0
本文作者: 呂倩 | 2017-07-31 15:50 |
隨著物聯(lián)網(wǎng)和智能化時(shí)代的到來(lái),人類和計(jì)算機(jī)之間將產(chǎn)生一種全新的交互方式——自然語(yǔ)音交互。
不論智能音箱的興盛是泡沫、虛火,還是行業(yè)爆發(fā)前的預(yù)熱,作為核心技術(shù)支持存在的智能語(yǔ)音操作系統(tǒng),已成為具備決定性作用的存在,日益受到各廠商的重視。在歐美,Echo 能夠成為現(xiàn)象級(jí)產(chǎn)品,很大程度得益于其背后的Alexa。國(guó)內(nèi)智能語(yǔ)音系統(tǒng)企業(yè)也紛紛以Alexa系統(tǒng)為標(biāo)尺。
成立于 2007 年的思必馳始終致力于語(yǔ)音技術(shù)與產(chǎn)品的結(jié)合,近期,多款由其提供核心技術(shù)支持的智能語(yǔ)音產(chǎn)品相繼面世——包括天貓精靈X1、聯(lián)想智能音箱、小米音箱、兒童機(jī)器人、智能后視鏡等可對(duì)話產(chǎn)品等。
八月,思必馳或?qū)⒄缴暇€研發(fā)許久的智能語(yǔ)音交互平臺(tái)DUI。思必馳VP趙恒藝對(duì)雷鋒網(wǎng)表示,簡(jiǎn)單直接地說(shuō),思必馳DUI的根本目的,就是打造中文版Alexa。
1、
過(guò)去,思必馳主要有兩大產(chǎn)品線:一個(gè)是基于自然對(duì)話的語(yǔ)音識(shí)別和語(yǔ)義分析的 AIOS(AISpeech Operating System)人機(jī)對(duì)話操作系統(tǒng),另一個(gè)是基于音頻芯片和麥克風(fēng)陣列的 AICHIP (AISpeech Chips)智能語(yǔ)音芯片模組。
2017年上半年,思必馳上百人團(tuán)隊(duì)封閉研發(fā)一款智能語(yǔ)音交互平臺(tái)——DUI,據(jù)雷鋒網(wǎng)了解,該平臺(tái)將于八月底上線。
實(shí)際上,智能語(yǔ)音的本質(zhì)是提取信號(hào)做處理,而對(duì)話交互不僅僅包含語(yǔ)音信息,也包括有來(lái)有往的信息交換。
就目前來(lái)講,對(duì)話交互大致可分為問(wèn)答式、命令式、任務(wù)式、閑聊式這四種類型,從思必馳角度來(lái)講,則專注于垂直場(chǎng)景,以任務(wù)式對(duì)話為核心,兼具閑聊與問(wèn)答功能,打造人性化交互。而DUI開(kāi)放平臺(tái)AISpeech Dialogue User Interface就是基于Dialogue,基于對(duì)話定制。
趙恒藝對(duì)雷鋒網(wǎng)表示,目前DUI基本都是從思必馳上一代人工智能操作系統(tǒng)AIOS基礎(chǔ)上承襲新的設(shè)計(jì)與架構(gòu),而新舊系統(tǒng)之間,更多是一種“凈化”的關(guān)系。
除此之外,DUI將在AIOS基礎(chǔ)之上,更加側(cè)重超高度自由定制,如場(chǎng)景化的多輪對(duì)話,這是之前AIOS所沒(méi)有的東西,屬于完全由思必馳自我研發(fā)。
而對(duì)于操作系統(tǒng)的升級(jí)更迭原因,趙恒藝對(duì)雷鋒網(wǎng)表示,一方面,技術(shù)總要經(jīng)歷迭代與進(jìn)步,原系統(tǒng)AIOS當(dāng)時(shí)確實(shí)在跨平臺(tái)以及硬件系統(tǒng)操作等方面起到非常重要的作用,但同時(shí)也存在一些需要提高改進(jìn)的地方;同時(shí),整個(gè)AIOS系統(tǒng)也是為各合作廠商定制的,當(dāng)他們針對(duì)性地提出改進(jìn)意見(jiàn),如“更高效的定義喚醒詞,實(shí)現(xiàn)在線更新”等時(shí),作為行業(yè)解決方案提供者,“思必馳當(dāng)仁不讓”,趙恒藝這樣講道。
目前,思必馳在業(yè)內(nèi)已與眾多合作伙伴攜手打造諸多智能硬件產(chǎn)品,如智能音箱、智能藍(lán)牙遙控器、智能冰箱、智能燈控、智能后視鏡、兒童陪伴機(jī)器人、兒童故事機(jī)等,在過(guò)程中,很多廠商在產(chǎn)品自定義、內(nèi)容升級(jí)、系統(tǒng)迭代等方面存在很大需求,這為AI語(yǔ)音市場(chǎng)帶來(lái)極大的發(fā)展空間和機(jī)遇。
另外一方面,針對(duì)語(yǔ)義和對(duì)話的定制系統(tǒng),廠商一旦需要對(duì)產(chǎn)品進(jìn)行迭代更新,即需要雙方聯(lián)調(diào),這種情況下實(shí)時(shí)性較差。這實(shí)際上就是過(guò)去時(shí)所延伸出來(lái)的一些新需求,進(jìn)而促進(jìn)一個(gè)新平臺(tái)的誕生。所以,“我們?cè)谠O(shè)計(jì)DUI的過(guò)程中,延續(xù)了技術(shù)戰(zhàn),同時(shí)也把過(guò)去較大的用戶痛點(diǎn)都給解決掉。”
2、
基于目前智能語(yǔ)音在實(shí)踐中應(yīng)用面臨的問(wèn)題,為個(gè)人/企業(yè)開(kāi)發(fā)者們提供開(kāi)放的可高度定制的對(duì)話平臺(tái)成為剛需。
思必馳DUI開(kāi)放平臺(tái)包括陣列、聲紋、喚醒、識(shí)別、合成、語(yǔ)義、對(duì)話、GUI等完整的人機(jī)對(duì)話交互核心技術(shù),基于目前成熟的語(yǔ)音技術(shù)基礎(chǔ)之上,提供開(kāi)放定制能力,這是一個(gè)從前端語(yǔ)音信號(hào)處理到后端資源對(duì)接、技能開(kāi)發(fā)等一站式的對(duì)話定制平臺(tái)。
那么,用戶到底需要什么?
趙恒藝以自己過(guò)去任樂(lè)視旗下樂(lè)樂(lè)語(yǔ)音CEO的身份舉例稱,相關(guān)產(chǎn)品的定制與智能語(yǔ)音交互技術(shù)的結(jié)合是沒(méi)有那么快的,在具體需求與定制步調(diào)中間永遠(yuǎn)存在一個(gè)差距,上升空間總是很小,這是需要解決的問(wèn)題。
而在DUI系統(tǒng)中,只需要將定制工作變成不需要集成代碼就可以。因?yàn)橹靶枰?、需要測(cè)試,同樣一個(gè)語(yǔ)言模式,在產(chǎn)品內(nèi)使用到不同地方,看上去都是一樣的,但實(shí)際上是UI并不同。
不僅如此,可視化的數(shù)據(jù)開(kāi)發(fā)平臺(tái),“云+端”的混合模式,能夠讓開(kāi)發(fā)者實(shí)時(shí)掌控?cái)?shù)據(jù)變動(dòng),依據(jù)產(chǎn)品用戶需求,實(shí)時(shí)更新產(chǎn)品功能,用戶可在第一時(shí)間感受最新技能,借此,思必馳通過(guò)C端及B端的應(yīng)用變化,將進(jìn)一步優(yōu)化DUI開(kāi)放平臺(tái),總體而言,這是一個(gè)多方共贏的趨勢(shì)。
同時(shí),趙恒藝表示,思必馳DUI開(kāi)放平臺(tái)將堅(jiān)持開(kāi)放的生態(tài)合作,支持多版本服務(wù),連接技術(shù)、內(nèi)容、硬件及服務(wù),提供數(shù)據(jù)跟蹤增值服務(wù)、用戶畫(huà)像在線運(yùn)營(yíng)、團(tuán)隊(duì)協(xié)作內(nèi)部管理、實(shí)時(shí)測(cè)試產(chǎn)品效果、多版本管理增量熱更新等服務(wù)。這些功能和服務(wù)以模塊化形式對(duì)外開(kāi)放,充分考慮了開(kāi)發(fā)者在使用DUI平臺(tái)進(jìn)行軟件開(kāi)發(fā)和后續(xù)擴(kuò)展的需求,助力應(yīng)用快速成型。DUI平臺(tái)將以良好的向后兼容性進(jìn)行升級(jí)與擴(kuò)展,開(kāi)發(fā)者無(wú)需顧慮DUI平臺(tái)升級(jí)對(duì)原有程序的影響,從而減輕開(kāi)發(fā)及運(yùn)營(yíng)壓力。
除了預(yù)熱對(duì)DUI的發(fā)布,思必馳表示將撥出2億基金,用以扶持平臺(tái)上優(yōu)秀的開(kāi)發(fā)者、優(yōu)秀應(yīng)用案例和創(chuàng)業(yè)項(xiàng)目,顯示了思必馳通過(guò)DUI開(kāi)放平臺(tái)讓語(yǔ)音賦能萬(wàn)物的決心。這將推動(dòng)語(yǔ)音交互技術(shù)的應(yīng)用領(lǐng)域,也將催生更多AI賦能產(chǎn)品的出現(xiàn),加快人工智能技術(shù)的商業(yè)化落地,進(jìn)一步走進(jìn)千家萬(wàn)戶。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。