0
本文作者: 包永剛 | 2018-05-18 19:10 |
5月17日,科大訊飛在深圳舉辦了名為「AI·飛無(wú)界」的新品發(fā)布會(huì)。三年前,科大訊飛首次將AIUI推向市場(chǎng),去年AIUI開(kāi)放平臺(tái)的發(fā)布,那么今年的AIUI3.0將有哪些值得期待的革新?另外,發(fā)布會(huì)上還發(fā)布了魔飛2.0、AIoT、iFLY OS,其中的免費(fèi)厚禮到底是什么?
科大訊飛消費(fèi)者BG執(zhí)行總裁于繼棟
科大訊飛消費(fèi)者BG執(zhí)行總裁于繼棟在發(fā)布會(huì)上首先回顧了訊飛開(kāi)放平臺(tái)以及AIUI發(fā)展的歷程,他表示,從2011年訊飛開(kāi)放平臺(tái)開(kāi)放之后我們經(jīng)歷了很長(zhǎng)的發(fā)展階段。從具體的數(shù)據(jù)看,2013年開(kāi)放平臺(tái)開(kāi)發(fā)者注冊(cè)數(shù)為3.9萬(wàn),2015年達(dá)到12.1萬(wàn),2017年有51.2萬(wàn),到了2018年5月16日,開(kāi)發(fā)者注冊(cè)數(shù)量已經(jīng)達(dá)到了80萬(wàn)人。當(dāng)然開(kāi)放平臺(tái)以及AIUI平臺(tái)都是全領(lǐng)域覆蓋,涵蓋教育、通訊、機(jī)器人、購(gòu)物等。于繼棟同時(shí)透露,科大訊飛AI的合作伙伴已經(jīng)超過(guò)5萬(wàn)。
從開(kāi)發(fā)者的陣營(yíng)來(lái)看,移動(dòng)端開(kāi)發(fā)者的增長(zhǎng)的數(shù)量占比最大,其中包括微信小程序以及其他外部API和Java小程序調(diào)用的快速增長(zhǎng)。另外,Windows以及Linux陣營(yíng)的開(kāi)發(fā)者的快速增加分別代表著辦公場(chǎng)景和智能硬件領(lǐng)域AI正在逐漸落地。
于繼棟還分享了一組數(shù)據(jù),目前,每天在訊飛開(kāi)放平臺(tái)上產(chǎn)生的語(yǔ)音交互次數(shù)超過(guò)45億次,交互次數(shù)比較多的前幾大應(yīng)用是,移動(dòng)端超過(guò)40億次,音響超過(guò)4000萬(wàn)次,電視超過(guò)2600萬(wàn)次,車(chē)載超過(guò)2000萬(wàn)次,商用機(jī)器人超過(guò)300萬(wàn)次。
科大訊飛開(kāi)放平臺(tái)的AI功能
AIUI 3.0 :三大革新
不過(guò),即便AIUI已經(jīng)有大量的開(kāi)發(fā)者和用戶(hù),但于繼棟表示:“自2015年AIUI正式發(fā)布以來(lái),我們看到無(wú)數(shù)開(kāi)發(fā)者為追求真正優(yōu)秀的產(chǎn)品、最真實(shí)自然的人機(jī)交互、零失誤的語(yǔ)音識(shí)別而奮斗。為了更好地為開(kāi)發(fā)者賦能,我們將這些追求納入心愿單,在AIUI3.0中帶來(lái)了三大革新?!?/p>
革新1:半監(jiān)督優(yōu)化
半監(jiān)督優(yōu)化能夠通過(guò)系統(tǒng)分析產(chǎn)品日志,了解各種熱門(mén)說(shuō)法并推薦給開(kāi)發(fā)者,并由分析產(chǎn)品日志和聚類(lèi)算法推薦用戶(hù)想要的其它技能,幫助開(kāi)發(fā)者不斷改進(jìn)產(chǎn)品和提升效率。
同時(shí),對(duì)于說(shuō)法的回復(fù),允許開(kāi)發(fā)者有多種處理方式,如使用系統(tǒng)推薦的技能,如閑聊技能進(jìn)行回答,自己定義業(yè)務(wù)進(jìn)行回答,或者接入廣告進(jìn)行推薦。
AIUI3.0 開(kāi)放式交互
革新2:開(kāi)放式對(duì)話(huà)
在語(yǔ)音交互中,封閉式對(duì)話(huà)以機(jī)器為中心,易于控制,但是交互自然度低,開(kāi)放式對(duì)話(huà)以人為中心,更接近自然的交流方式,同時(shí)語(yǔ)義消歧的難度也更大。
AIUI3.0能夠做到開(kāi)放式交互,讓交互更貼近自然,并且不斷地演進(jìn)和優(yōu)化效果,這也是AIUI3.0的一大優(yōu)勢(shì)。
革新3:全鏈路打通&動(dòng)態(tài)詞匯
要聽(tīng)懂用戶(hù),語(yǔ)義理解能力和語(yǔ)音識(shí)別準(zhǔn)確度兩手都要硬。
AIUI打通了語(yǔ)音識(shí)別、語(yǔ)義理解以及語(yǔ)音合成全鏈路個(gè)性化網(wǎng)絡(luò),提高各類(lèi)場(chǎng)景下的理解能力和識(shí)別率;同時(shí)擁有基于場(chǎng)景動(dòng)態(tài)詞匯技術(shù),讓用戶(hù)說(shuō)出所看到內(nèi)容都能被準(zhǔn)確識(shí)別,達(dá)到所見(jiàn)即所說(shuō)。
當(dāng)然,AIUI3.0除了上述功能外,還有自定義問(wèn)答、自定義技能、對(duì)話(huà)托管、云函數(shù)、可嵌入開(kāi)發(fā)者WiFi soc的二麥在線(xiàn)交互模塊等特性。AIUI平臺(tái)的技能也已經(jīng)達(dá)到了120多個(gè),內(nèi)容超過(guò)60種。
因此,基于AIUI 3.0 集成的語(yǔ)音喚醒、語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成、IoT 等核心技術(shù),優(yōu)化的技能平臺(tái),整合硬件、SDK、WebAPI、芯片、小程序等接入平臺(tái),科大訊飛構(gòu)成了一張豐富的系統(tǒng)架構(gòu)全景圖。
魔飛(MORFEI ):增加2個(gè)新功能
魔飛是科大訊飛在2017年6月發(fā)布的一款麥克風(fēng)成品開(kāi)發(fā)方案,魔飛1.0的雙環(huán)八麥購(gòu)行解決了傳統(tǒng)拾音設(shè)備只能放在桌面上的問(wèn)題,通過(guò)與AIUI配合,提供了快速開(kāi)發(fā)的能力,科大訊飛也已經(jīng)通過(guò)魔飛1.0與許多開(kāi)發(fā)者共同探索了很多家居的產(chǎn)品。
不過(guò),魔飛的產(chǎn)品經(jīng)理涂康宏表示,魔飛1.0之后,我們發(fā)現(xiàn)有一些地方還有待提升,如回聲消除。今年上半年我們大幅優(yōu)化了回聲消除和藍(lán)牙回踩,使它的效果在原有的基礎(chǔ)上提升了100%,另外通過(guò)優(yōu)化整個(gè)系統(tǒng)架構(gòu),使系統(tǒng)變得更加穩(wěn)定,功耗也降低了50%。
魔飛2.0
當(dāng)然,除了已有功能的優(yōu)化,魔飛2.0還增加了分布式和能量跟隨兩個(gè)創(chuàng)新功能。
分布式能力:過(guò)去,用戶(hù)對(duì)多臺(tái)設(shè)備進(jìn)行喚醒時(shí),命令執(zhí)行會(huì)引發(fā)多臺(tái)設(shè)備同時(shí)被喚醒的尷尬局面。現(xiàn)在,多臺(tái)設(shè)備在同一個(gè)局域網(wǎng)和賬戶(hù)號(hào)下,喊出「魔飛魔飛」喚醒詞時(shí),所有在局域網(wǎng)內(nèi)的設(shè)備會(huì)進(jìn)行喚醒分值計(jì)算,離用戶(hù)最近的那一臺(tái)設(shè)備優(yōu)先響應(yīng)用戶(hù)喚醒。
能量跟隨能力:過(guò)去,設(shè)備被喚醒之后麥克風(fēng)陣列會(huì)根據(jù)聲源的位置指定一個(gè)固定的波束方向,除非用戶(hù)再次喚醒設(shè)備,否則波束方向不會(huì)改變?,F(xiàn)在,波束可以根據(jù)用戶(hù)的位置和聲源地移動(dòng),動(dòng)態(tài)的調(diào)整播出方向,給用戶(hù)帶來(lái)更自然的交互體驗(yàn)。
涂康宏還表示,魔飛2.0超越了固定的硬件形態(tài)的局限,軟核化使其可以安裝在各類(lèi)硬件設(shè)備中,能巧妙融入起居環(huán)境中。
所以魔飛2.0開(kāi)放了全鏈路,開(kāi)放音頻、文本、語(yǔ)義、合成四種接口。還有聲紋喚醒接口的開(kāi)放,讓魔飛能在喚醒后瞬間知道用戶(hù)身份,使開(kāi)發(fā)者可以快速調(diào)用聲紋信息,圍繞用戶(hù)搭建個(gè)性化場(chǎng)景推薦。
發(fā)布會(huì)的現(xiàn)場(chǎng),科大訊飛還舉辦了一場(chǎng)語(yǔ)音技能開(kāi)發(fā)的挑戰(zhàn),4 位開(kāi)發(fā)者用了大概1小時(shí)的時(shí)間分別完成了程序員字典、我唱你猜、新電影推薦、會(huì)場(chǎng)抽獎(jiǎng)的技能開(kāi)發(fā),并通過(guò)現(xiàn)場(chǎng)配置好的魔飛麥克風(fēng),現(xiàn)場(chǎng)也成功演示和驗(yàn)證。
AIoT:實(shí)現(xiàn)更多智能IoT設(shè)備的互聯(lián)互通
數(shù)據(jù)顯示,2014年到2018年終端設(shè)備的數(shù)量正急速增長(zhǎng),2018年硬件終端規(guī)模將達(dá)到19億,其中手機(jī)端占比約92%,8%預(yù)示著智能硬件時(shí)代的到來(lái)。但智能不僅是交互的升級(jí),還是萬(wàn)物相互連接產(chǎn)生的巨大能量。為了滿(mǎn)足開(kāi)發(fā)者對(duì)智能設(shè)備間互通互聯(lián)的期待,訊飛智能物聯(lián)云AIoT也由此誕生。
訊飛智能物聯(lián)云AIoT
據(jù)雷鋒網(wǎng)了解,訊飛智能物聯(lián)云AIoT有云及霧兩大能力:
云能力提供開(kāi)放、聚合、智能的云服務(wù)平臺(tái)。
霧能力是通過(guò)霧計(jì)算使整體系統(tǒng)不受網(wǎng)絡(luò)波動(dòng)的影響,響應(yīng)時(shí)間快;這種分布式的能力能充分利用設(shè)備原有空閑的計(jì)算資源,降低系統(tǒng)成本。
這兩大能力被整合到 PaaS 級(jí)的開(kāi)發(fā)平臺(tái)里,為開(kāi)發(fā)者提供AI接口和開(kāi)放設(shè)備連接,創(chuàng)建個(gè)性化智能場(chǎng)景。開(kāi)發(fā)者既可以從第三方云端接入AIoT,也可以設(shè)備直連。
現(xiàn)場(chǎng),訊飛的團(tuán)隊(duì)也通過(guò)廚房的場(chǎng)景,為大家展示了基于訊飛智能物聯(lián)云AIoT的設(shè)備互聯(lián)互通和多模態(tài)人機(jī)交互的能力。
iFLY OS:一份免費(fèi)的厚禮
新品發(fā)布的最后,于繼棟向大家展示了一份“厚禮”——系統(tǒng)級(jí)解決方案iFLYOS。iFLYOS 整合了訊飛語(yǔ)音喚醒、語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解這四大基礎(chǔ)技術(shù)能力并免費(fèi)開(kāi)放給開(kāi)發(fā)者,并且整合了 1300 萬(wàn)首咪咕高清音樂(lè)、20 萬(wàn)部海豚有聲內(nèi)容、以及 3 萬(wàn)部院線(xiàn)大片。
系統(tǒng)級(jí)解決方案
另外,iFLYOS 還提供了 API 開(kāi)放接口、開(kāi)源了端代碼、兼容亞馬遜 AVS 可以讓亞馬遜設(shè)備快速接入訊飛方便開(kāi)發(fā)者的開(kāi)發(fā)。
不過(guò),由于iFLYOS在發(fā)布會(huì)現(xiàn)場(chǎng)于繼棟才公布開(kāi)啟內(nèi)測(cè),所以這個(gè)系統(tǒng)級(jí)解決方案的更多細(xì)節(jié)還等待科大訊飛的逐步公開(kāi),雷鋒網(wǎng)也將為你持續(xù)關(guān)注。
新的100項(xiàng)AI能力正在開(kāi)放
于繼棟發(fā)布完四款新品之后,在深圳28℃的夜晚,科大訊飛執(zhí)行總裁胡郁卻穿著西裝站上臺(tái)做了題為《賦能開(kāi)發(fā)者 創(chuàng)造新時(shí)代》的分享。對(duì)此,他解釋道:“2010年我們訊飛開(kāi)放平臺(tái)剛剛成立,在那年的發(fā)布會(huì)上我穿的就是這套西裝??赡芎芏嘈』锇橐舶l(fā)現(xiàn)了,這套西裝的扣子和袖口已經(jīng)磨損,但沒(méi)有關(guān)系,正是因?yàn)槟切┻^(guò)往的歷史時(shí)刻,才成就了我們的今天?!?/p>
科大訊飛執(zhí)行總裁胡郁
對(duì)于為何看好語(yǔ)音技術(shù),胡郁表示,90% 信息輸出依靠語(yǔ)音,80% 信息輸入依靠視覺(jué),人與機(jī)器之間的交互也通過(guò)人的語(yǔ)音語(yǔ)言和機(jī)器的顯示屏形成一個(gè)循環(huán)。因此他堅(jiān)信基于視覺(jué)呈現(xiàn)的語(yǔ)音交互技術(shù)是未來(lái)的發(fā)展方向。他還舉了一些例子,如跑步等移動(dòng)場(chǎng)景人們佩戴耳機(jī)的無(wú)視覺(jué)呈現(xiàn)的語(yǔ)音交互;車(chē)載環(huán)境對(duì)著后視鏡的弱視覺(jué)呈現(xiàn)的語(yǔ)音交互;還有家庭環(huán)境在電視、投影等屏幕前的強(qiáng)視覺(jué)呈現(xiàn)的語(yǔ)音交互等。
基于視覺(jué)呈現(xiàn)的語(yǔ)音交互技術(shù)是未來(lái)的發(fā)展方向
胡郁回顧了科大訊飛的發(fā)展歷程,也提到了突顯核心技術(shù)對(duì)于企業(yè)長(zhǎng)久發(fā)展的重要性。說(shuō)到這里,他表示,很長(zhǎng)一段時(shí)間科大訊飛的盈利能力遭到外界的質(zhì)疑,其中很重要的一個(gè)原因就是科大訊飛每年在開(kāi)發(fā)者平臺(tái)和核心技術(shù)上的投入是上億級(jí)的。他指出,2017 年科大訊飛的技術(shù)投入占總營(yíng)收比重高達(dá) 61.61%,技術(shù)開(kāi)發(fā)團(tuán)隊(duì)的人數(shù)增長(zhǎng)率則高達(dá) 56.04%,均大幅高于 2016 年。
胡郁在發(fā)布會(huì)上還表示科大訊飛開(kāi)放平臺(tái)將在2018年度內(nèi)開(kāi)放新的100項(xiàng)AI能力,打造AI全領(lǐng)域開(kāi)放平臺(tái)。
科大訊飛AIUI智能硬件合作伙伴數(shù)量加速增長(zhǎng)
小結(jié)
科大訊飛此次的「AI·飛無(wú)界」新品發(fā)布會(huì)帶來(lái)了四款新品,從軟件開(kāi)發(fā)平臺(tái)AIUI3.0、硬件麥克風(fēng)成品開(kāi)發(fā)方案魔飛2.0到訊飛智能物聯(lián)云AIoT再到系統(tǒng)級(jí)解決方案iFLY OS,從軟件到硬件,從單品到系統(tǒng),科大訊飛基于其核心技術(shù)為開(kāi)發(fā)者準(zhǔn)備好了一整套的解決方案。
這對(duì)于開(kāi)發(fā)者而言,門(mén)檻以及成本的降低無(wú)疑具有巨大的吸引力,特別是在有了iFLY OS之后,能讓更多的開(kāi)發(fā)者讓創(chuàng)意變成產(chǎn)品。而AIoT能解決困擾物聯(lián)網(wǎng)發(fā)展的智能設(shè)備之間互聯(lián)互通難題,這無(wú)論是對(duì)AI落地還是IoT的發(fā)展而言都是積極的消息??拼笥嶏w也能與開(kāi)發(fā)者共建一個(gè)更大的語(yǔ)音技術(shù)生態(tài)。
至于科大訊飛此次為何將AIUI的發(fā)布會(huì)選在深圳而不是北京,雷鋒網(wǎng)認(rèn)為其中的原因是深圳具有相對(duì)完備的硬件產(chǎn)業(yè)鏈,也有大量的智能硬件開(kāi)發(fā)者,發(fā)布會(huì)展示區(qū)搭載科大訊飛語(yǔ)音技術(shù)的多個(gè)機(jī)器人展商就來(lái)自深圳,這意味著科大訊飛很看好語(yǔ)音技術(shù)在智能安防、智能家居、智能機(jī)器人、可穿戴等智能硬件中的普及,也希望通過(guò)與深圳的開(kāi)發(fā)者共同推動(dòng)AI的落地。
現(xiàn)在關(guān)注“雷鋒網(wǎng)”微信公眾號(hào)(leiphone-sz),回復(fù)關(guān)鍵詞【2018】,隨機(jī)抽送價(jià)值 3999 元的參會(huì)門(mén)票 3 張
相關(guān)文章:
科大訊飛年度發(fā)布會(huì):重磅推出 10 款 AI+產(chǎn)品、AIUI 2.0,AI 賦能各行各業(yè)
科大訊飛胡郁:中國(guó)坐擁「登山型」和「沖浪型」企業(yè),將在中美人工智能角逐中勝出
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。