0
思必馳智能語音交互平臺DUI 此前經(jīng)歷了漫長的沉寂研發(fā),7月,思必馳揭開DUI的面紗,8月,正式將DUI上線,9月7日,思必馳終于正式開放出DUI 的平臺注冊。
1、
現(xiàn)場,思必馳創(chuàng)始人高始興介紹了 DUI 的生態(tài)布局。
2013 年,思必馳發(fā)布國內(nèi)第一個口語對話系統(tǒng)平臺——思必馳對話工場。2015 年,開始專注垂直場景的一站式解決方案: AIOS。2016 年初,思必馳開始策劃 DUI 平臺,年底 DUI 升級成為公司重大戰(zhàn)略方向之一。
高始興表示,2014 年轉(zhuǎn)型以來,思必馳專注賦能物聯(lián)網(wǎng) 3 年,賦能無數(shù)智能終端。
這位創(chuàng)始人還記得他們的第一場發(fā)布會——4 年前的9月7日 ,中關(guān)村3W 咖啡,一場面向移動互聯(lián)網(wǎng)開發(fā)者為主的平臺的發(fā)布會。四年時間,思必馳一直專注于將語音對話能力搭建在平臺上,賦能給移動互聯(lián)網(wǎng)的開發(fā)者。但那個時候,移動互聯(lián)網(wǎng)產(chǎn)業(yè)還在中前場發(fā)展,沒有人想象到下半場具體什么樣子。整個物聯(lián)網(wǎng)大產(chǎn)業(yè)還在非常早的早期,不像現(xiàn)在有爆品、產(chǎn)品的普及度很高,包括整個產(chǎn)業(yè)鏈的成熟度,人工智能的成熟度、落地速度和質(zhì)量等。
自2014年至 2014 年,高始興表示,團隊明顯感受到整個物聯(lián)網(wǎng)市場速度在加快,語音人工智能落地的速度在加快。于是,2014 年,思必馳將高速增長的教育業(yè)務(wù)做了剝離 。
這樣從時間軸上看,2012 年、2013 年,思必馳啟動面向移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)大市場的業(yè)務(wù)。 2014 年徹底轉(zhuǎn)型,專注在物聯(lián)網(wǎng)的大市場上(All in AI)。 2013 年,思必馳發(fā)布國內(nèi)第一個口語對話系統(tǒng):對話工場。
可以說, 思必馳這幾年一直在根據(jù)市場的發(fā)展、市場的需求在調(diào)整具體產(chǎn)品和業(yè)務(wù)定位——三次定位、三次調(diào)整。
2014 年,軟硬一體化車蘿卜,將語音人工智能落地到創(chuàng)新端
2015 年開始深度耕耘細分市場
2016 年開始專注做 DUI 平臺
此外,高始興提到思必馳創(chuàng)建的兩支基金—— 一個是天使基金,一個是 10 個億的成長基金。到現(xiàn)在為止,思必馳基金孵化、賦能、投資了 7 家企業(yè),包括車蘿卜、慧聲、 愛醫(yī)聲等公司 。
2、
思必馳 VP趙恒藝 進一步解釋了DUI 平臺的核心是什么 ?為什么做好一款 AI 產(chǎn)品會這么難?
在趙恒藝看來,當(dāng)前行業(yè)的主要矛盾,實際上是技術(shù)提供商的定制效率,與B 端客戶產(chǎn)品迭代的需求不能夠被很好地滿足。為了解決這個矛盾,思必馳推出了DUI 平臺。
據(jù)雷鋒網(wǎng)了解,DUI平臺是思必馳首個全鏈路對話定制平臺,內(nèi)置AI技能商店,面向開發(fā)者提供完整的智能對話交互方案,支持快速自定義開發(fā),主打智能車載、智能家居、智能機器人、手機助手等應(yīng)用場景。
DUI相關(guān)技術(shù)負(fù)責(zé)人對雷鋒網(wǎng)表示,DUI平臺主要由產(chǎn)品和技能兩大板塊組成,包含四個子系統(tǒng),第一是天機系統(tǒng),支持實時的數(shù)據(jù)監(jiān)測和系統(tǒng)反饋預(yù)警,包含數(shù)據(jù)源、數(shù)據(jù)平臺、應(yīng)用層;第二是青囊系統(tǒng),包含運營監(jiān)控、問題反饋、項目管理;第三是玲瓏系統(tǒng),支持跨平臺、離線使用;第四是紫薇系統(tǒng),包含接口資源平臺,兼容AVS服務(wù)。
DUI語音對話定制的獨特性在哪里呢?趙恒藝對雷鋒網(wǎng)表示,我們支持從喚醒到識別,到語義解析,到對話管理等一系列各個模塊的定制。同時,根據(jù)技能進行獨立的定制,會有一個很高的擴展性。
此外,趙恒藝強調(diào),DUI不僅支持多種形式的對話,還可以跨技能,針對各種技能之間、業(yè)務(wù)之間的跳轉(zhuǎn),以及內(nèi)部技能和外部技能一系列的整合,我們都做了很好的融合。在語音合成上,既支持自己的定制,也可以提供 SSML 語言,對合成音進行個性化的標(biāo)注。DUI 即將推出個性化合成音的定制,通過簡單的幾句自己的錄音,就 可以生成一個自己的合成音。這僅僅需要幾個小時的時間。
趙恒藝對雷鋒網(wǎng)表示,技能定制是整個 DUI 核心環(huán)節(jié),DUI 平臺提供的語音識別模型不僅是通用的語言模型,思必馳在這個基礎(chǔ)上,更是將所有技能獨立得訓(xùn)練成個性化的語言模型。同時,我們這個訓(xùn)練的過程很短,分鐘級的訓(xùn)練,我們就可以 刷新這樣一個語言模型。云端發(fā)布后,馬上就可以使用。
實際上,自思必馳首次預(yù)告、推出DUI語音回話定制平臺,雷鋒網(wǎng)便有跟蹤報道,此次與之前最大不同,在于GUI 交互和對話交互的融合。
比如說,趙恒藝舉例稱,假設(shè)搜索附近的酒店,可能會出現(xiàn) N 個搜索結(jié)果,而針對這些酒店的不同特性,會存在不同信息篩選點,比如四星級、五星級,均價 300 到 500 元的不同 ,以及從哪兒到目的地去,是收藏第幾個等等,非常多 GUI 的組建,都需要讓對話管理和GUI 進行非常好的結(jié)合,也正因此,思必馳創(chuàng)造性地開發(fā)出DUI 控件,將 GUI 和 DUI 進行融合,使得每個 Button 都可以與意圖對應(yīng)起來。
“在安卓系統(tǒng)內(nèi),DUI 提供不同架構(gòu),無論前端APP的交互技術(shù)方案如何變化,都可以找到方式,使得對話管理與GUI 場景化具體融合?!壁w恒藝稱。
3、
剛剛加入思必馳的原阿里iDST總監(jiān)、現(xiàn)擔(dān)任思必馳VP、思必馳北京研發(fā)院院長的初敏博士,目前主要專注于拓展語音技術(shù)在物聯(lián)網(wǎng)外的新業(yè)務(wù)、新場景的落地。她于現(xiàn)場再次強調(diào),加入思必馳的最大原因,就是雙方有著共同的夢想,認(rèn)為智能的交互模式在未來會變得越來越重要。
初敏表示,目前的語音交互與對話智能,相對來說處在天時地利人和的時間點了,并且技術(shù)本身的效果已經(jīng)開始呈現(xiàn)。
一方面,對深度學(xué)習(xí)來說,包括對數(shù)據(jù)的采集和獲取的能力變得更強。從這點來講, 其實是因為有了數(shù)據(jù)驅(qū)動以后,才會有了機器學(xué)習(xí)。
第二方面是要多嘗試,初敏表示,今天現(xiàn)場的很多演示,在很多年前的實驗室技術(shù)探索階段就已經(jīng)開始了。目前大家不論是在電腦、還是移動端所做的的所有事情都是很自然的,是隨著移動設(shè)備的普及而逐漸變?yōu)樽匀欢坏男枨蟆?/p>
當(dāng)然,初敏表示,語音交互到目前還沒有出現(xiàn)真正特別成功的案例,原因上,初敏表示,一方面是由于行業(yè)規(guī)模還沒達到, 可能還需要兩到三年的時間。
其次,語音交互是一個大的系統(tǒng)的合成,而不是某一個單元。 這個技術(shù)要求可以運用在任何場景、任何產(chǎn)品,必然是一個龐大的系統(tǒng)工程。
4月16日 20:30-21:30 ,雷鋒網(wǎng)旗下學(xué)術(shù)頻道 AI 科技評論聯(lián)合AI慕課學(xué)院、騰訊課堂邀請思必馳CMO龍夢竹為大家?guī)硪粓鲋辈シ窒?!點擊鏈接報名參與吧!!
課程主題:《人工智能需要科學(xué)家,也需要普通人》
報名鏈接:https://ke.qq.com/huodong/aiqzzty_pc/index.html#tuin=8f7939df
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。