0
本文作者: 汪思穎 | 2018-07-05 11:03 |
雷鋒網(wǎng) AI 研習社按,百度 AI 開發(fā)者大會于 2018 年 7 月 4 日正式開幕,當天上午,百度展示了他們強大的智能客服助理。詳情請戳如下視頻:
可以看到,智能客服助理不僅能與人流暢對話,也能自如應對人類的閑聊。究竟這一系統(tǒng)是靠何種技術來支撐?在當天下午的百度大腦分論壇上,來自百度視覺技術部、百度語音技術部、百度 AI 技術生態(tài)部、百度大數(shù)據(jù)部的多位負責人帶來了對百度語音語義技術的詳細解讀,除了技術解讀,他們還表示,未來,將會有更多技術開放給開發(fā)者,用戶可以利用百度最新升級的 PaddlePaddle3.0,參加各種各樣的開放競賽,感受技術帶來的無盡魅力。雷鋒網(wǎng) AI 研習社也第一時間提取出大會亮點,以饗讀者。
視覺語義、語音語義和知識圖譜
論壇伊始,百度視覺技術部、人臉技術部、增強現(xiàn)實技術部總監(jiān)吳中勤為大家介紹了視覺語義化的作用——可以讓機器從看清到看懂視頻,并提煉出結構化語義知識。他表示,視覺語義化技術首先識別人、物體和場景,同時捕捉它們之間的行為和關系,通過時序化、數(shù)字化、結構化的方式形成語義知識,最終進行智慧推理,落地應用。
他描述了百度語義化平臺的技術架構。首先是底層依賴,這里包括數(shù)據(jù)采集、光學傳感器、嵌入式芯片、云端計算服務,上層是識別算法,包括人體/人臉分析、物體檢測/識別/分割、文字識別、場景分析,再往上是語義分析層,包括動作檢測/識別、視頻跟蹤、事件分析,接下來是產(chǎn)品方案層,包括智慧分析與推理、可視化展現(xiàn)等,最上層是豐富的應用場景。
他表示,未來,百度視覺語義化技術也將開放給開發(fā)者使用。
除了視覺語義化,語音語義一體化也非常重要。
百度語音技術部總監(jiān)高亮表示,百度目前在遠場語音語義上有三個最新技術突破,一是語音語義一體化,二是多語種混合聲學建模,三是將傳統(tǒng)拼接技術與 WaveNet 融合。他表示,語音語義一體化將遠場交互中高頻 Query 識別準確率提升 10 個點,并保持普通 Query 識別率不降。他也具體介紹了如何解決遠場交互的高頻 Query,可以看到其中涉及到語言模型、聲學模型、高頻知識庫、語義糾錯等多個方面。
2017 年,百度推出 Deep Peak2 建模技術,這一技術適合多語種建模的上下文無關的音素組合建模,無需考慮音素組合的前后音連,大幅提升了中英文混合 Query 識別準確率。
另外,遠場語音技術低成本解決方案「度小云」也在此時發(fā)布,這一方案基于 Deep Peak V2 語音識別技術,以及面向高頻 Query 優(yōu)化的語音語義一體化技術和 LSTM-VAD 深度學習語音切分技術等,據(jù)悉,未來開發(fā)者可以直接一站式獲取這一遠場語音能力。
除了前面提到的視覺語義和語音語義,將語言變成知識也非常重要。百度 AI 技術平臺體系執(zhí)行總監(jiān)吳甜對百度語言與知識技術布局進行了全面解讀,這其中包括計算、推理、知識圖譜、語言理解、語言生成等多層技術。
她在現(xiàn)場介紹了百度多元語義知識圖譜,其中包含實體圖譜、行業(yè)知識圖譜、事件圖譜、關注點圖譜、多媒體圖譜,目前,實體圖譜已經(jīng)能夠滿足 90% 用戶需求,行業(yè)知識圖譜也已經(jīng)覆蓋億級專業(yè)資源,多媒體圖譜包含十億張圖片與音視頻語義標簽,能精準關聯(lián) 95% 熱門實體。
她表示,百度理解與交互技術平臺 UNIT 發(fā)布至今,已經(jīng)有 1 萬名開發(fā)者參與其中,累計創(chuàng)建了 1.3 萬條技能,發(fā)起 33 萬次啟發(fā)式訓練,8 萬次模型訓練。目前,UNIT 升級至 2.0,進一步增強了冷啟動能力,能像人一樣在實踐中學習。
從百度語言與知識開放技術藍圖中可以看到,目前百度的實體標注、文本糾錯、評論觀點定制化、對話情緒識別等多種功能已經(jīng)正式開放。
吳甜表示,未來,百度將會開放實體屬性填充、長文本實體標注、內容生成解決方案等多種技術。
PaddlePaddle3.0 以及各類比賽和工具
值得一提的是,在上午的主論壇上,王海峰正式發(fā)布 PaddlePaddle3.0,下午,百度 AI 技術生態(tài)部總經(jīng)理喻友平對此進行了詳細解讀。
從 PaddlePaddle 的歷史說起,2012 年 1 月,百度開始深度學習技術研發(fā),2013 年,百度開始自研深度學習平臺服務百度多項核心業(yè)務,2016 年 9 月,百度開源自研深度學習框架 PaddlePaddle,2017 年 11 月,發(fā)布新一代深度學習框架 PaddlePaddle Fluid,到今天,宣布 PaddlePaddle 升級為 3.0 版本。
PaddlePaddle3.0 的核心框架包括 PaddlePaddle Fluid、PaddlePaddle Serving、PaddlePaddle Mobile,以及 AI Studio 在線實訓平臺、AutoDL 網(wǎng)絡結構自動化設計平臺、EasyDL 快速應用平臺。喻友平表示,目前百度已經(jīng)開放部分訓練好的常用模型,如 NLP(中文情感分析、中文詞法分析)、語音(DeepASR)、視覺(圖像分類、目標檢測、人臉檢測等)、強化學習(DQN)、AutoDL(模型設計、模型遷移、模型適配)等。
他也提到百度目前基于 PaddlePaddle 的多項比賽,今年下半年會有工信部首屆生物特征識別技術開發(fā)者大賽、華大基因變異檢測賽事、KG 知識抽取、交通預測、車道線識別等多項競賽,大家現(xiàn)在就可以關注。
而百度大數(shù)據(jù)(北京)實驗室主任浣軍則詳細介紹了 PaddlePaddle3.0 中的 AutoDL。他表示,有了 AutoDL,開發(fā)者無需特殊軟硬件設備和特殊訓練,可以快速得到定制化高質量的模型,能更高效自動搜索神經(jīng)網(wǎng)絡結構。AutoDL 支持設計全新深度學習網(wǎng)絡結構,優(yōu)化現(xiàn)有深度學習網(wǎng)絡結構及參數(shù),同時能夠適配特定任務場景。
百度大數(shù)據(jù)部總監(jiān)郭謝也為在場觀眾正式介紹百度大數(shù)據(jù)眾智開放平臺「點石」,其中包括三個開發(fā)工具,Datalab、預置算法庫、預制模型庫。
可以看到,Datalab 是專為開發(fā)者打造的交互式在線數(shù)據(jù)開發(fā)工具,支持 Python 等多語言的交互式開發(fā)環(huán)境,集成百度 PaddlePaddle 以及 TensorFlow 等優(yōu)秀開源深度學習框架。目前 Datalab 已經(jīng)開放限量邀測通道,7 月 8 日截止,各位小伙伴們可以抓緊時間。
相信不管你從事數(shù)據(jù)科學的哪項研究,都會在百度開發(fā)者大會上找到自己感興趣的方向。而在第二天,精彩繼續(xù),雷鋒網(wǎng) AI 研習社也將為大家?guī)沓掷m(xù)報導。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。