2
“對于一款機器人什么才是最重要的?”
“思維!”
11月6日下午,圖靈機器人在北京國家會議中心舉辦了發(fā)布會,正式發(fā)布了自主研發(fā)的機器人操作系統(tǒng)——Turing OS。前幾年手機市場正熱的時候,常??梢月牭降木褪歉魇交贏ndroid深度定制的OS,作為比手機更加復(fù)雜的機器人,設(shè)計操作系統(tǒng)的難度當(dāng)然會更高。
圖靈機器人CEO俞志晨現(xiàn)場介紹,Turing OS橫跨了機器人、人工智能、操作系統(tǒng)三個維度。而想要弄清楚Turing OS,首先就需要解決交互、引擎、應(yīng)用這三個問題。
對于用戶來說,機器人的好壞首先體現(xiàn)的在人機交互上,這也是困擾了很多機器人創(chuàng)業(yè)者的問題,目前主流的方式就是語音交互。俞志晨介紹,機器人有一個“人”字,團隊在尋找人與機器人最好的交互方式時,最先分析的就是人與人之間最自然的交互。
人與人之間主要通過文字內(nèi)容、語音語調(diào)、表情動作傳遞信息,稱之為多模態(tài)交互。雖然這是人們習(xí)慣的交互模式,但俞志晨坦言,對于機器人來說,“技術(shù)上是非常難的”。目前圖靈團隊也申請了相關(guān)的專利。
機器人操作系統(tǒng)有情感計算、思維強化、自學(xué)習(xí)三大引擎。為了讓機器人有情感,圖靈與國內(nèi)的研發(fā)機構(gòu)合作,研發(fā)出一套名為情感TTS技術(shù)。機器人語音普遍采用的TTS技術(shù),但一般的TTS語音很程序化,換句話說就是語氣沒有情感。現(xiàn)場對比一般TTS和情感TTS,顯然,更加后者更像是跟人在交流。目前Turing OS支持25種語言類情感,識別準(zhǔn)確率95.1%。
機器人的思維主要體現(xiàn)在交互的內(nèi)容上,通常的問題就是呆板和混亂。由于語音交互中,往往是一些關(guān)鍵詞的反饋,所以常常會出現(xiàn)“上句說A,下句說到B”的情況。通過加強思維,可以讓機器人的邏輯變得合理,為此圖靈團隊調(diào)研了8個幼兒園、300個家庭、1100人,收集到了55萬條數(shù)據(jù),并且花費了11個月的時間,給Turing OS增加了26種宏觀思維,10140種微觀思維。
給機器人強化思維最直接的體現(xiàn)就是使用時間。沒有經(jīng)過強化的機器人,第一周的平均使用時間是11分鐘,而到了第五周的平均使用時間則僅為2分鐘。通過思維強化后,機器人第一周平均被使用35分鐘,而到了第五周依然有24分鐘。
“思維強化有多復(fù)雜?”
“光是給思維下個定義,團隊就花了4個月的時間?!?/p>
近幾年,語音識別和圖像識別的技術(shù)發(fā)展非常好,也出現(xiàn)了如科大訊飛這類的專業(yè)公司,但在自然語言處理和語義識別上卻并沒有太大進展。圖靈想要保證OS的體驗,就需要解決這兩個問題,而途徑就是在算法(D-RNN)、大數(shù)據(jù)(10萬合作伙伴、3億用戶,每日億級數(shù)據(jù)量)和超高性能計算機(天河二號)上。并且自學(xué)習(xí)的迭代周期從原有的7天變?yōu)榱爽F(xiàn)在的實時升級。
為了保證Turing OS的實際應(yīng)用,圖靈團隊調(diào)研了25個家庭使用場景的需求,在發(fā)布會現(xiàn)場,俞志晨強調(diào)了OS的兒童對話深度過濾機制。針對孩子的語音交流,需要避免很多語音助手存在的“段子”問題,很多內(nèi)容其實是不適合小孩子的。Turing OS的過濾機制可以保證語言的純凈度在99.87%。
除了軟件之外,圖靈還在現(xiàn)場宣布與奧飛動漫合作,將OS集成到不同的玩具中。玩具市場雖然看起來琳瑯滿目,但產(chǎn)品本身都是大同小異,差別并不大。在玩具對智能的需求越來越大時,Turing OS存在的價值就體現(xiàn)出來了。相比于目前并不成熟的消費級機器人市場,將人工智能應(yīng)用到玩具這個成熟市場中,目前僅相當(dāng)于4~5歲智力水平的Turing OS顯然更加合適。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。