丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給叨叨
發(fā)送

0

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

本文作者: 叨叨 2017-07-06 07:56
導(dǎo)語(yǔ):DuerOS 是什么

7月5日,百度 AI 開(kāi)發(fā)者大會(huì)。還不到下午一點(diǎn)半,對(duì)話(huà)式人工智能分論壇已經(jīng)人滿(mǎn)為患,A 廳的保安堵著門(mén),出來(lái)一個(gè)才會(huì)放一個(gè)進(jìn)去。在這場(chǎng)下午兩點(diǎn)開(kāi)始,總共耗時(shí)三個(gè)半小時(shí)的分論壇中,先后換了三位主講人,才把景鯤所講的“聽(tīng)清、聽(tīng)懂、滿(mǎn)足”的 DuerOS 整體架構(gòu)講完。

差不多同一時(shí)刻,阿里也在北京召開(kāi)發(fā)布會(huì),發(fā)布了旗下第一款智能音箱。此前已經(jīng)有不少好事媒體紛紛猜測(cè),群眾舉瓜圍觀,畢竟巨頭分庭抗禮的戲碼沒(méi)有人會(huì)厭倦。

雷鋒網(wǎng)整理了百度分論壇的全部?jī)?nèi)容,并精選出與 DuerOS 直接相關(guān)的信息,試圖清楚的回答“DuerOS是什么” 的問(wèn)題,或許這也是全網(wǎng)關(guān)于 DuerOS 最全面的解剖:

DuerOS 整體架構(gòu)

DuerOS 的整體架構(gòu)包括三層:中間層為核心層,即對(duì)話(huà)系統(tǒng);最上層為應(yīng)用層,即智能設(shè)備開(kāi)放平臺(tái);最底層為能力層,即技能開(kāi)放平臺(tái)。

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

所謂的核心層,包括了從語(yǔ)音識(shí)別到語(yǔ)音播報(bào)再到屏幕顯示的一個(gè)完整交互流程,以及背后支撐交互的自然語(yǔ)言理解、對(duì)話(huà)狀態(tài)控制、自然語(yǔ)言生成、搜索等等核心技術(shù),這些技術(shù)支撐著上下兩層的實(shí)現(xiàn)。

所謂的應(yīng)用層,則是為第三方廠(chǎng)商提供包括核心接入組件、芯片模組、麥克風(fēng)陣列等的開(kāi)發(fā)套件,以及包括工業(yè)設(shè)計(jì)、結(jié)構(gòu)設(shè)計(jì)、音腔設(shè)計(jì)在內(nèi)的參考設(shè)計(jì)方案。

所謂的能力層,則是面向開(kāi)發(fā)者,提供了包括了原生技能和第三方技能在內(nèi)的技能開(kāi)放平臺(tái),開(kāi)發(fā)者可以通過(guò)技能工具,來(lái)創(chuàng)建并發(fā)布基于 DuerOS 的技能。

三層之間的結(jié)合處,分別是對(duì)話(huà)服務(wù)和技能框架兩個(gè)接口,也是整個(gè) DuerOS 的核心接口,前者為終端設(shè)備提供了各項(xiàng)支持請(qǐng)求,體現(xiàn) DuerOS 的終端能力,后者為第三方開(kāi)發(fā)者豐富的創(chuàng)建方式,體現(xiàn) DuerOS 的技能開(kāi)發(fā)能力。

為了更清楚的理解,針對(duì)對(duì)話(huà)服務(wù)與技術(shù)框架,百度直接拿 DuerOS 和 Andriod 系統(tǒng)做了對(duì)比:

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

如同電腦、平板在 Android 系統(tǒng)上具備觸摸的交互功能一樣,音箱、電視、車(chē)載設(shè)備搭載了 DuerOS 后,就能具備智能語(yǔ)音對(duì)話(huà)的交互功能。

如同 Android 設(shè)備驅(qū)動(dòng)程序接口,定義能夠運(yùn)行的基本硬件和交互方式一樣,DuerOS 的對(duì)話(huà)系統(tǒng)則定義著運(yùn)行 DuerOS 需要具備的終端能力,以及用戶(hù)通過(guò)設(shè)備和 DuerOS 溝通時(shí)的交互方式。

如同開(kāi)發(fā)者基于 Android 應(yīng)用框架能夠開(kāi)發(fā) App 一樣,第三方開(kāi)發(fā)者也可以基于 DuerOS 的技能框架開(kāi)發(fā)技能,在搭載 DuerOS 的智能設(shè)備上運(yùn)行。

舉例來(lái)說(shuō):

搭載 DuerOS 的電視,具備了屏幕顯示的能力,當(dāng)一個(gè)設(shè)備具備了屏幕顯示能力的時(shí),DuerOS 就可以響應(yīng)這種服務(wù)的請(qǐng)求,識(shí)別之后通過(guò)屏幕告訴用戶(hù)正確的答案。搭載 DuerOS 的手機(jī),用戶(hù)就可以通過(guò)語(yǔ)音操作打電話(huà)給家人或者向餐館訂餐。搭載 DuerOS 的汽車(chē),具備車(chē)輛控制功能,你可以跟汽車(chē)說(shuō)天太熱了,把天窗打開(kāi),把空調(diào)調(diào)到19度。這是 DuerOS 支持的協(xié)議具備多種多樣的終端能力。

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

針對(duì)技術(shù)框架,DuerOS 提供標(biāo)準(zhǔn)化的接口,第三方開(kāi)發(fā)者甚至可以一行代碼都不編寫(xiě),就能創(chuàng)造標(biāo)準(zhǔn)化的技能,只要提供內(nèi)容即可。針對(duì)需要個(gè)性化創(chuàng)造的開(kāi)發(fā)者,DuerOS 提供了豐富的技能接入,開(kāi)發(fā)者不需要懂自然語(yǔ)言處理和深度學(xué)習(xí),就能創(chuàng)造非常自如的語(yǔ)音交互技能。

除了智能創(chuàng)建工具之外,DuerOS 還提供全套平臺(tái)工具,覆蓋從創(chuàng)建、配置到百度云部署、測(cè)試、發(fā)布的整個(gè)生命周期。通過(guò) DuerOS 的技能框架,百度把 DuerOS 的原生技能開(kāi)發(fā)能力、自然語(yǔ)言處理能力、對(duì)話(huà)管理能力等全部開(kāi)放給了第三方開(kāi)發(fā)者。

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

核心層:對(duì)話(huà)系統(tǒng)

當(dāng)用戶(hù)開(kāi)始和 DuerOS 說(shuō)話(huà)時(shí),它的工作流程是這樣的:

  • 用戶(hù)的語(yǔ)音先傳到 ASR 語(yǔ)音識(shí)別模塊,通過(guò)該模塊,設(shè)備聽(tīng)清用戶(hù)的語(yǔ)言,將它轉(zhuǎn)為文字;

  • 轉(zhuǎn)成的文字經(jīng)過(guò)相應(yīng)模塊的分析、識(shí)別和理解,并放在整個(gè)對(duì)話(huà)上下文當(dāng)中做充分識(shí)別和理解,明確語(yǔ)義。

  • 當(dāng) DuerOS 聽(tīng)懂之后,則會(huì)調(diào)用合適的原生技能或第三方技能來(lái)滿(mǎn)足用戶(hù),通過(guò) TTS 語(yǔ)音播報(bào)將結(jié)果給到用戶(hù),如果設(shè)備有屏幕,則會(huì)給出適合設(shè)備屏幕大小形狀的展示結(jié)果。

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

經(jīng)過(guò)這樣的工作流程,DuerOS 的對(duì)話(huà)系統(tǒng)可以通過(guò)音箱、電視、車(chē)機(jī)等設(shè)備,應(yīng)用在多種場(chǎng)景中。之所以能夠有好的聽(tīng)清、聽(tīng)懂效果,百度認(rèn)為主要?dú)w功于三個(gè)方面:數(shù)據(jù)多、技術(shù)深、內(nèi)容廣。

所謂的數(shù)據(jù)指的是百度擁有龐大的知識(shí)圖譜、需求圖譜、網(wǎng)頁(yè)圖譜、地理信息圖譜及用戶(hù)畫(huà)像,技術(shù)則指的是十余年里百度所積累的自然語(yǔ)言處理、對(duì)話(huà)控制、對(duì)話(huà)管理、自然語(yǔ)言生成、搜索等技術(shù),而內(nèi)容指的是百度擁有的超過(guò)10000個(gè)信息垂類(lèi)內(nèi)容。

智能設(shè)備開(kāi)放平臺(tái)

官方給出的智能設(shè)備開(kāi)放平臺(tái)的目標(biāo)是“上手”最容易的設(shè)備平臺(tái)。簡(jiǎn)單而言,就是對(duì)于第三方來(lái)說(shuō), 直接把百度給出的方案拿過(guò)來(lái)套上用,就可以了。但針對(duì)需求,百度還是給出了幾個(gè)版本的開(kāi)發(fā)套件:

  • 個(gè)人版-針對(duì)開(kāi)發(fā)者

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

個(gè)人版開(kāi)發(fā)套件基于 DevKit ,集成了 2Mic 兼容設(shè)計(jì),同時(shí)也支持 4Mic,和 Crom 引擎合作完成。即日起就可以下載,不僅完善了硬件,還加上了系統(tǒng)對(duì)象和文檔。

有趣的是,在個(gè)人版里,百度提供了一個(gè)趣味組裝圖紙,讓開(kāi)發(fā)者動(dòng)手組裝。個(gè)人版既保留了一些自主行性,也節(jié)省了大量的時(shí)間,確實(shí)非常容易“上手”。

  • 標(biāo)準(zhǔn)版-針對(duì)產(chǎn)品廠(chǎng)商

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

針對(duì)產(chǎn)品廠(chǎng)商需要穩(wěn)定、可靠、大規(guī)模生產(chǎn)的需求,百度給出了“標(biāo)準(zhǔn)”答案。標(biāo)準(zhǔn)版開(kāi)發(fā)套件完全按照 產(chǎn)品級(jí)要求研發(fā),包括 4Mic 拾音板、MTK8516 主板,Wi-Fi/BT+喇叭,終端軟件為 Linux+DuerOS SDK+終端應(yīng)用,它的目標(biāo)是開(kāi)箱即用。

此外,百度還聯(lián)合設(shè)計(jì)團(tuán)隊(duì)推出了標(biāo)準(zhǔn)版產(chǎn)品的參考設(shè)計(jì),同時(shí)由來(lái)自手機(jī)團(tuán)隊(duì)資深結(jié)構(gòu)工程師專(zhuān)門(mén)做了結(jié)構(gòu)化的設(shè)計(jì),由資深的電聲工程師調(diào)整了電路效果,甚至和音箱代工廠(chǎng)制定了完整的工藝,貼上商標(biāo)就可以對(duì)外銷(xiāo)售。

  • 輕量版-針對(duì)特殊廠(chǎng)商

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

針對(duì)有些特殊要求的廠(chǎng)商,比如產(chǎn)品需要電池系統(tǒng)、需要低功耗、需要放到已有產(chǎn)品中,同時(shí)不希望增加成本等情況,百度則提供了輕量版開(kāi)發(fā)套件。

發(fā)布會(huì)中提到了 ARM 和 DevKit 合作的兩款專(zhuān)門(mén)支持 DevKit 和 ARMmbed 的解決方案,Cortex 為核心的解決方案,非常省電的,作為實(shí)時(shí)操作系統(tǒng),配置也相當(dāng)靈活,既有單板方案也有雙板。套件里是高度整合的 SoC 系統(tǒng),全部裝在一個(gè)單芯片上,本身就保證了低成本,小體積,甚至只有硬幣的大小。

  • 第三方方案

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

除了上述三個(gè)百度提供的版本方案外,還和業(yè)界一些第三方廠(chǎng)商做了合作,讓 DuerOS 融合第三方解決方案,這其中包括了聲智科技、先聲互聯(lián)、Intel、Rockchip、Qualcomm 等,還有更多正在進(jìn)行中,沒(méi)有完工的廠(chǎng)商。

與這些設(shè)備解決方案配套的,是一款基于手機(jī)的 App——小度之家。據(jù)雷鋒網(wǎng)了解,在以語(yǔ)音交互為主的設(shè)備上,有兩個(gè)很常見(jiàn)的問(wèn)題,一是配網(wǎng)不方便,二是設(shè)置不方便。通過(guò)小度之家 App,這兩個(gè)問(wèn)題都可以得到徹底解決。在這個(gè) App 上,一方面可以看到操作記錄,另一方面也支持付費(fèi)功能。更重要的是,將來(lái)會(huì)有更多的第三方技能會(huì)出現(xiàn)在這個(gè) App 上。

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

技能開(kāi)放平臺(tái)

技能開(kāi)放平臺(tái)分為三個(gè)部分,一個(gè)部分是百度提供的原聲技能,第二個(gè)部分是為第三方開(kāi)放的技能工具,第三個(gè)部分是由開(kāi)發(fā)者開(kāi)發(fā)的第三方技能。

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

這些技能綜合起來(lái),就是為了讓語(yǔ)音交互設(shè)備更好用,具有更多功能,讓用戶(hù)聽(tīng)懂并得到滿(mǎn)足。雷鋒網(wǎng)了解到,百度的原聲技能覆蓋了從娛樂(lè)到生活,從信息到工具十個(gè)大類(lèi),超過(guò)100個(gè)子類(lèi),且還在不斷增加。

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

通過(guò)開(kāi)發(fā)工具,開(kāi)發(fā)者可以開(kāi)發(fā)第三方技能,百度還提供了標(biāo)準(zhǔn)的技能模板,可以幫助開(kāi)發(fā)者無(wú)門(mén)檻的創(chuàng)建技能。從開(kāi)始創(chuàng)建到最終發(fā)布,都有百度的技術(shù)支持。而上傳到技能商店的技能,終端用戶(hù)都可以根據(jù)自己的需要來(lái)選擇或者購(gòu)買(mǎi)喜歡的技能,平臺(tái)中的“監(jiān)控”功能,還可以為開(kāi)發(fā)者優(yōu)化技能提供決策數(shù)據(jù)。

聽(tīng)清、聽(tīng)懂、滿(mǎn)足:DuerOS 整體架構(gòu)最全解剖

小結(jié)

如果用決定論來(lái)理解百度今日對(duì)“操作系統(tǒng)”的執(zhí)念,或許想想它曾錯(cuò)失的移動(dòng)互聯(lián)網(wǎng)時(shí)代就能夠理解。希望這是深刻反思后看清楚的方向,而不是某種矯枉過(guò)正的偏執(zhí)。但無(wú)論如何,正如一位前百度員工說(shuō)的那樣,“我只相信技術(shù)”。此刻的百度,或許最接近李彥宏心目中的百度,或許也是國(guó)內(nèi)最相信技術(shù)的大公司。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)北京編輯。關(guān)注人工智能,略雜。微信(yougo5654)可以找到我。
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)