0
本文作者: 呂倩 | 2017-07-31 15:50 |
隨著物聯(lián)網(wǎng)和智能化時代的到來,人類和計算機之間將產(chǎn)生一種全新的交互方式——自然語音交互。
不論智能音箱的興盛是泡沫、虛火,還是行業(yè)爆發(fā)前的預(yù)熱,作為核心技術(shù)支持存在的智能語音操作系統(tǒng),已成為具備決定性作用的存在,日益受到各廠商的重視。在歐美,Echo 能夠成為現(xiàn)象級產(chǎn)品,很大程度得益于其背后的Alexa。國內(nèi)智能語音系統(tǒng)企業(yè)也紛紛以Alexa系統(tǒng)為標(biāo)尺。
成立于 2007 年的思必馳始終致力于語音技術(shù)與產(chǎn)品的結(jié)合,近期,多款由其提供核心技術(shù)支持的智能語音產(chǎn)品相繼面世——包括天貓精靈X1、聯(lián)想智能音箱、小米音箱、兒童機器人、智能后視鏡等可對話產(chǎn)品等。
八月,思必馳或?qū)⒄缴暇€研發(fā)許久的智能語音交互平臺DUI。思必馳VP趙恒藝對雷鋒網(wǎng)表示,簡單直接地說,思必馳DUI的根本目的,就是打造中文版Alexa。
1、
過去,思必馳主要有兩大產(chǎn)品線:一個是基于自然對話的語音識別和語義分析的 AIOS(AISpeech Operating System)人機對話操作系統(tǒng),另一個是基于音頻芯片和麥克風(fēng)陣列的 AICHIP (AISpeech Chips)智能語音芯片模組。
2017年上半年,思必馳上百人團隊封閉研發(fā)一款智能語音交互平臺——DUI,據(jù)雷鋒網(wǎng)了解,該平臺將于八月底上線。
實際上,智能語音的本質(zhì)是提取信號做處理,而對話交互不僅僅包含語音信息,也包括有來有往的信息交換。
就目前來講,對話交互大致可分為問答式、命令式、任務(wù)式、閑聊式這四種類型,從思必馳角度來講,則專注于垂直場景,以任務(wù)式對話為核心,兼具閑聊與問答功能,打造人性化交互。而DUI開放平臺AISpeech Dialogue User Interface就是基于Dialogue,基于對話定制。
趙恒藝對雷鋒網(wǎng)表示,目前DUI基本都是從思必馳上一代人工智能操作系統(tǒng)AIOS基礎(chǔ)上承襲新的設(shè)計與架構(gòu),而新舊系統(tǒng)之間,更多是一種“凈化”的關(guān)系。
除此之外,DUI將在AIOS基礎(chǔ)之上,更加側(cè)重超高度自由定制,如場景化的多輪對話,這是之前AIOS所沒有的東西,屬于完全由思必馳自我研發(fā)。
而對于操作系統(tǒng)的升級更迭原因,趙恒藝對雷鋒網(wǎng)表示,一方面,技術(shù)總要經(jīng)歷迭代與進步,原系統(tǒng)AIOS當(dāng)時確實在跨平臺以及硬件系統(tǒng)操作等方面起到非常重要的作用,但同時也存在一些需要提高改進的地方;同時,整個AIOS系統(tǒng)也是為各合作廠商定制的,當(dāng)他們針對性地提出改進意見,如“更高效的定義喚醒詞,實現(xiàn)在線更新”等時,作為行業(yè)解決方案提供者,“思必馳當(dāng)仁不讓”,趙恒藝這樣講道。
目前,思必馳在業(yè)內(nèi)已與眾多合作伙伴攜手打造諸多智能硬件產(chǎn)品,如智能音箱、智能藍牙遙控器、智能冰箱、智能燈控、智能后視鏡、兒童陪伴機器人、兒童故事機等,在過程中,很多廠商在產(chǎn)品自定義、內(nèi)容升級、系統(tǒng)迭代等方面存在很大需求,這為AI語音市場帶來極大的發(fā)展空間和機遇。
另外一方面,針對語義和對話的定制系統(tǒng),廠商一旦需要對產(chǎn)品進行迭代更新,即需要雙方聯(lián)調(diào),這種情況下實時性較差。這實際上就是過去時所延伸出來的一些新需求,進而促進一個新平臺的誕生。所以,“我們在設(shè)計DUI的過程中,延續(xù)了技術(shù)戰(zhàn),同時也把過去較大的用戶痛點都給解決掉?!?/p>
2、
基于目前智能語音在實踐中應(yīng)用面臨的問題,為個人/企業(yè)開發(fā)者們提供開放的可高度定制的對話平臺成為剛需。
思必馳DUI開放平臺包括陣列、聲紋、喚醒、識別、合成、語義、對話、GUI等完整的人機對話交互核心技術(shù),基于目前成熟的語音技術(shù)基礎(chǔ)之上,提供開放定制能力,這是一個從前端語音信號處理到后端資源對接、技能開發(fā)等一站式的對話定制平臺。
那么,用戶到底需要什么?
趙恒藝以自己過去任樂視旗下樂樂語音CEO的身份舉例稱,相關(guān)產(chǎn)品的定制與智能語音交互技術(shù)的結(jié)合是沒有那么快的,在具體需求與定制步調(diào)中間永遠存在一個差距,上升空間總是很小,這是需要解決的問題。
而在DUI系統(tǒng)中,只需要將定制工作變成不需要集成代碼就可以。因為之前需要集成、需要測試,同樣一個語言模式,在產(chǎn)品內(nèi)使用到不同地方,看上去都是一樣的,但實際上是UI并不同。
不僅如此,可視化的數(shù)據(jù)開發(fā)平臺,“云+端”的混合模式,能夠讓開發(fā)者實時掌控數(shù)據(jù)變動,依據(jù)產(chǎn)品用戶需求,實時更新產(chǎn)品功能,用戶可在第一時間感受最新技能,借此,思必馳通過C端及B端的應(yīng)用變化,將進一步優(yōu)化DUI開放平臺,總體而言,這是一個多方共贏的趨勢。
同時,趙恒藝表示,思必馳DUI開放平臺將堅持開放的生態(tài)合作,支持多版本服務(wù),連接技術(shù)、內(nèi)容、硬件及服務(wù),提供數(shù)據(jù)跟蹤增值服務(wù)、用戶畫像在線運營、團隊協(xié)作內(nèi)部管理、實時測試產(chǎn)品效果、多版本管理增量熱更新等服務(wù)。這些功能和服務(wù)以模塊化形式對外開放,充分考慮了開發(fā)者在使用DUI平臺進行軟件開發(fā)和后續(xù)擴展的需求,助力應(yīng)用快速成型。DUI平臺將以良好的向后兼容性進行升級與擴展,開發(fā)者無需顧慮DUI平臺升級對原有程序的影響,從而減輕開發(fā)及運營壓力。
除了預(yù)熱對DUI的發(fā)布,思必馳表示將撥出2億基金,用以扶持平臺上優(yōu)秀的開發(fā)者、優(yōu)秀應(yīng)用案例和創(chuàng)業(yè)項目,顯示了思必馳通過DUI開放平臺讓語音賦能萬物的決心。這將推動語音交互技術(shù)的應(yīng)用領(lǐng)域,也將催生更多AI賦能產(chǎn)品的出現(xiàn),加快人工智能技術(shù)的商業(yè)化落地,進一步走進千家萬戶。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。