0
本文作者: 呂倩 | 2017-09-08 12:37 |
思必馳智能語(yǔ)音交互平臺(tái)DUI 此前經(jīng)歷了漫長(zhǎng)的沉寂研發(fā),7月,思必馳揭開(kāi)DUI的面紗,8月,正式將DUI上線,9月7日,思必馳終于正式開(kāi)放出DUI 的平臺(tái)注冊(cè)。
1、
現(xiàn)場(chǎng),思必馳創(chuàng)始人高始興介紹了 DUI 的生態(tài)布局。
2013 年,思必馳發(fā)布國(guó)內(nèi)第一個(gè)口語(yǔ)對(duì)話系統(tǒng)平臺(tái)——思必馳對(duì)話工場(chǎng)。2015 年,開(kāi)始專注垂直場(chǎng)景的一站式解決方案: AIOS。2016 年初,思必馳開(kāi)始策劃 DUI 平臺(tái),年底 DUI 升級(jí)成為公司重大戰(zhàn)略方向之一。
高始興表示,2014 年轉(zhuǎn)型以來(lái),思必馳專注賦能物聯(lián)網(wǎng) 3 年,賦能無(wú)數(shù)智能終端。
這位創(chuàng)始人還記得他們的第一場(chǎng)發(fā)布會(huì)——4 年前的9月7日 ,中關(guān)村3W 咖啡,一場(chǎng)面向移動(dòng)互聯(lián)網(wǎng)開(kāi)發(fā)者為主的平臺(tái)的發(fā)布會(huì)。四年時(shí)間,思必馳一直專注于將語(yǔ)音對(duì)話能力搭建在平臺(tái)上,賦能給移動(dòng)互聯(lián)網(wǎng)的開(kāi)發(fā)者。但那個(gè)時(shí)候,移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)還在中前場(chǎng)發(fā)展,沒(méi)有人想象到下半場(chǎng)具體什么樣子。整個(gè)物聯(lián)網(wǎng)大產(chǎn)業(yè)還在非常早的早期,不像現(xiàn)在有爆品、產(chǎn)品的普及度很高,包括整個(gè)產(chǎn)業(yè)鏈的成熟度,人工智能的成熟度、落地速度和質(zhì)量等。
自2014年至 2014 年,高始興表示,團(tuán)隊(duì)明顯感受到整個(gè)物聯(lián)網(wǎng)市場(chǎng)速度在加快,語(yǔ)音人工智能落地的速度在加快。于是,2014 年,思必馳將高速增長(zhǎng)的教育業(yè)務(wù)做了剝離 。
這樣從時(shí)間軸上看,2012 年、2013 年,思必馳啟動(dòng)面向移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)大市場(chǎng)的業(yè)務(wù)。 2014 年徹底轉(zhuǎn)型,專注在物聯(lián)網(wǎng)的大市場(chǎng)上(All in AI)。 2013 年,思必馳發(fā)布國(guó)內(nèi)第一個(gè)口語(yǔ)對(duì)話系統(tǒng):對(duì)話工場(chǎng)。
可以說(shuō), 思必馳這幾年一直在根據(jù)市場(chǎng)的發(fā)展、市場(chǎng)的需求在調(diào)整具體產(chǎn)品和業(yè)務(wù)定位——三次定位、三次調(diào)整。
2014 年,軟硬一體化車蘿卜,將語(yǔ)音人工智能落地到創(chuàng)新端
2015 年開(kāi)始深度耕耘細(xì)分市場(chǎng)
2016 年開(kāi)始專注做 DUI 平臺(tái)
此外,高始興提到思必馳創(chuàng)建的兩支基金—— 一個(gè)是天使基金,一個(gè)是 10 個(gè)億的成長(zhǎng)基金。到現(xiàn)在為止,思必馳基金孵化、賦能、投資了 7 家企業(yè),包括車蘿卜、慧聲、 愛(ài)醫(yī)聲等公司 。
2、
思必馳 VP趙恒藝 進(jìn)一步解釋了DUI 平臺(tái)的核心是什么 ?為什么做好一款 AI 產(chǎn)品會(huì)這么難?
在趙恒藝看來(lái),當(dāng)前行業(yè)的主要矛盾,實(shí)際上是技術(shù)提供商的定制效率,與B 端客戶產(chǎn)品迭代的需求不能夠被很好地滿足。為了解決這個(gè)矛盾,思必馳推出了DUI 平臺(tái)。
據(jù)雷鋒網(wǎng)了解,DUI平臺(tái)是思必馳首個(gè)全鏈路對(duì)話定制平臺(tái),內(nèi)置AI技能商店,面向開(kāi)發(fā)者提供完整的智能對(duì)話交互方案,支持快速自定義開(kāi)發(fā),主打智能車載、智能家居、智能機(jī)器人、手機(jī)助手等應(yīng)用場(chǎng)景。
DUI相關(guān)技術(shù)負(fù)責(zé)人對(duì)雷鋒網(wǎng)表示,DUI平臺(tái)主要由產(chǎn)品和技能兩大板塊組成,包含四個(gè)子系統(tǒng),第一是天機(jī)系統(tǒng),支持實(shí)時(shí)的數(shù)據(jù)監(jiān)測(cè)和系統(tǒng)反饋預(yù)警,包含數(shù)據(jù)源、數(shù)據(jù)平臺(tái)、應(yīng)用層;第二是青囊系統(tǒng),包含運(yùn)營(yíng)監(jiān)控、問(wèn)題反饋、項(xiàng)目管理;第三是玲瓏系統(tǒng),支持跨平臺(tái)、離線使用;第四是紫薇系統(tǒng),包含接口資源平臺(tái),兼容AVS服務(wù)。
DUI語(yǔ)音對(duì)話定制的獨(dú)特性在哪里呢?趙恒藝對(duì)雷鋒網(wǎng)表示,我們支持從喚醒到識(shí)別,到語(yǔ)義解析,到對(duì)話管理等一系列各個(gè)模塊的定制。同時(shí),根據(jù)技能進(jìn)行獨(dú)立的定制,會(huì)有一個(gè)很高的擴(kuò)展性。
此外,趙恒藝強(qiáng)調(diào),DUI不僅支持多種形式的對(duì)話,還可以跨技能,針對(duì)各種技能之間、業(yè)務(wù)之間的跳轉(zhuǎn),以及內(nèi)部技能和外部技能一系列的整合,我們都做了很好的融合。在語(yǔ)音合成上,既支持自己的定制,也可以提供 SSML 語(yǔ)言,對(duì)合成音進(jìn)行個(gè)性化的標(biāo)注。DUI 即將推出個(gè)性化合成音的定制,通過(guò)簡(jiǎn)單的幾句自己的錄音,就 可以生成一個(gè)自己的合成音。這僅僅需要幾個(gè)小時(shí)的時(shí)間。
趙恒藝對(duì)雷鋒網(wǎng)表示,技能定制是整個(gè) DUI 核心環(huán)節(jié),DUI 平臺(tái)提供的語(yǔ)音識(shí)別模型不僅是通用的語(yǔ)言模型,思必馳在這個(gè)基礎(chǔ)上,更是將所有技能獨(dú)立得訓(xùn)練成個(gè)性化的語(yǔ)言模型。同時(shí),我們這個(gè)訓(xùn)練的過(guò)程很短,分鐘級(jí)的訓(xùn)練,我們就可以 刷新這樣一個(gè)語(yǔ)言模型。云端發(fā)布后,馬上就可以使用。
實(shí)際上,自思必馳首次預(yù)告、推出DUI語(yǔ)音回話定制平臺(tái),雷鋒網(wǎng)便有跟蹤報(bào)道,此次與之前最大不同,在于GUI 交互和對(duì)話交互的融合。
比如說(shuō),趙恒藝舉例稱,假設(shè)搜索附近的酒店,可能會(huì)出現(xiàn) N 個(gè)搜索結(jié)果,而針對(duì)這些酒店的不同特性,會(huì)存在不同信息篩選點(diǎn),比如四星級(jí)、五星級(jí),均價(jià) 300 到 500 元的不同 ,以及從哪兒到目的地去,是收藏第幾個(gè)等等,非常多 GUI 的組建,都需要讓對(duì)話管理和GUI 進(jìn)行非常好的結(jié)合,也正因此,思必馳創(chuàng)造性地開(kāi)發(fā)出DUI 控件,將 GUI 和 DUI 進(jìn)行融合,使得每個(gè) Button 都可以與意圖對(duì)應(yīng)起來(lái)。
“在安卓系統(tǒng)內(nèi),DUI 提供不同架構(gòu),無(wú)論前端APP的交互技術(shù)方案如何變化,都可以找到方式,使得對(duì)話管理與GUI 場(chǎng)景化具體融合?!壁w恒藝稱。
3、
剛剛加入思必馳的原阿里iDST總監(jiān)、現(xiàn)擔(dān)任思必馳VP、思必馳北京研發(fā)院院長(zhǎng)的初敏博士,目前主要專注于拓展語(yǔ)音技術(shù)在物聯(lián)網(wǎng)外的新業(yè)務(wù)、新場(chǎng)景的落地。她于現(xiàn)場(chǎng)再次強(qiáng)調(diào),加入思必馳的最大原因,就是雙方有著共同的夢(mèng)想,認(rèn)為智能的交互模式在未來(lái)會(huì)變得越來(lái)越重要。
初敏表示,目前的語(yǔ)音交互與對(duì)話智能,相對(duì)來(lái)說(shuō)處在天時(shí)地利人和的時(shí)間點(diǎn)了,并且技術(shù)本身的效果已經(jīng)開(kāi)始呈現(xiàn)。
一方面,對(duì)深度學(xué)習(xí)來(lái)說(shuō),包括對(duì)數(shù)據(jù)的采集和獲取的能力變得更強(qiáng)。從這點(diǎn)來(lái)講, 其實(shí)是因?yàn)橛辛藬?shù)據(jù)驅(qū)動(dòng)以后,才會(huì)有了機(jī)器學(xué)習(xí)。
第二方面是要多嘗試,初敏表示,今天現(xiàn)場(chǎng)的很多演示,在很多年前的實(shí)驗(yàn)室技術(shù)探索階段就已經(jīng)開(kāi)始了。目前大家不論是在電腦、還是移動(dòng)端所做的的所有事情都是很自然的,是隨著移動(dòng)設(shè)備的普及而逐漸變?yōu)樽匀欢坏男枨蟆?/p>
當(dāng)然,初敏表示,語(yǔ)音交互到目前還沒(méi)有出現(xiàn)真正特別成功的案例,原因上,初敏表示,一方面是由于行業(yè)規(guī)模還沒(méi)達(dá)到, 可能還需要兩到三年的時(shí)間。
其次,語(yǔ)音交互是一個(gè)大的系統(tǒng)的合成,而不是某一個(gè)單元。 這個(gè)技術(shù)要求可以運(yùn)用在任何場(chǎng)景、任何產(chǎn)品,必然是一個(gè)龐大的系統(tǒng)工程。
4月16日 20:30-21:30 ,雷鋒網(wǎng)旗下學(xué)術(shù)頻道 AI 科技評(píng)論聯(lián)合AI慕課學(xué)院、騰訊課堂邀請(qǐng)思必馳CMO龍夢(mèng)竹為大家?guī)?lái)一場(chǎng)直播分享!點(diǎn)擊鏈接報(bào)名參與吧?。?br/>
課程主題:《人工智能需要科學(xué)家,也需要普通人》
報(bào)名鏈接:https://ke.qq.com/huodong/aiqzzty_pc/index.html#tuin=8f7939df
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。