0
本文作者: 李詩(shī) | 2018-10-03 00:13 |
這兩年,各大互聯(lián)網(wǎng)公司都在緊鑼密鼓地召開(kāi)AI大會(huì)、AI開(kāi)發(fā)者大會(huì),網(wǎng)易卻一直沒(méi)有行動(dòng)。9月26日,在中秋假期與國(guó)慶假期接壤的間隙,網(wǎng)易召開(kāi)了一場(chǎng)小型媒體workshop,雷鋒網(wǎng)得以與人工智能事業(yè)部總經(jīng)理李曉燕深入交流,一窺網(wǎng)易AI布局。
人工智能事業(yè)部總經(jīng)理李曉燕
網(wǎng)易目前有三大AI產(chǎn)品矩陣,首先是AR業(yè)務(wù)線,包括網(wǎng)易洞見(jiàn)、網(wǎng)易影見(jiàn);其次是對(duì)話AI業(yè)務(wù)線,有自己的硬件產(chǎn)品“網(wǎng)易三音云音箱”;網(wǎng)易也建立了AI平臺(tái)業(yè)務(wù)線,包括網(wǎng)易AI平臺(tái)、網(wǎng)易見(jiàn)外,與BAT的全開(kāi)放式AI平臺(tái)不同,網(wǎng)易還做深度定制AI項(xiàng)目。
李曉燕是網(wǎng)易人工智能元老級(jí)人物。2009年到2011年,李曉燕在浙江大學(xué)攻讀計(jì)算機(jī)博士生期間開(kāi)始在網(wǎng)易實(shí)習(xí),正式加入網(wǎng)易后組建了多媒體技術(shù)部,當(dāng)時(shí)第一批成員有6個(gè)人。
2012年,多媒體部門(mén)開(kāi)拓了計(jì)算機(jī)視覺(jué)、人臉識(shí)別、人臉認(rèn)證、圖像美化等技術(shù);
2013年拓展深度學(xué)習(xí)、語(yǔ)音識(shí)別、聽(tīng)歌識(shí)曲、數(shù)字水印、視頻編輯、人臉美化等技術(shù);
2014年深度學(xué)習(xí)算法全面升級(jí),圖像識(shí)別和檢索技術(shù)大幅提升,開(kāi)始服務(wù)網(wǎng)易游戲、音樂(lè)、易信等部門(mén);
2015年OCR、發(fā)音測(cè)試、圖像過(guò)濾、人臉SDK等技術(shù)升級(jí),擴(kuò)張服務(wù)網(wǎng)易郵箱、有道詞典/云筆記等;
2016年,增強(qiáng)現(xiàn)實(shí)、人工智能系統(tǒng)產(chǎn)品化,SLAM 2D/3D技術(shù)成熟,網(wǎng)易洞見(jiàn)、網(wǎng)易影見(jiàn)、網(wǎng)易見(jiàn)外、網(wǎng)易波特、AI平臺(tái)智能客服服務(wù)全面上線;
2017年,成立網(wǎng)易AI事業(yè)部、浙江省增強(qiáng)現(xiàn)實(shí)與智能交互工程技術(shù)研究中心;
2018年,全面探索商業(yè)化之路,網(wǎng)易三音云音箱上市、AI平臺(tái)對(duì)外開(kāi)放。
雖然網(wǎng)易布局AI已久,但是前幾年AI還沒(méi)有因深度學(xué)習(xí)而突飛猛進(jìn),無(wú)法上升到戰(zhàn)略層面。節(jié)點(diǎn)性的事件發(fā)生在2017年,網(wǎng)易AI團(tuán)隊(duì)升級(jí)為人工智能事業(yè)部,開(kāi)始真正為集團(tuán)其他業(yè)務(wù)賦能。網(wǎng)易也劃分出AI戰(zhàn)略的三條線:AI平臺(tái)、基于計(jì)算機(jī)視覺(jué)的網(wǎng)易AR、語(yǔ)音識(shí)別和NLP方向上的語(yǔ)音交互業(yè)務(wù)。
其實(shí)在2017年,BAT等已經(jīng)全面確定了AI戰(zhàn)略,也已經(jīng)鑼鼓喧天地對(duì)外宣布。網(wǎng)易一直等到現(xiàn)在都沒(méi)有大力推AI戰(zhàn)略,李曉燕解釋到:“網(wǎng)易是一家產(chǎn)品公司,以推產(chǎn)品為主,很少提戰(zhàn)略。網(wǎng)易是從做產(chǎn)品開(kāi)始,逐漸去呈現(xiàn)理念和對(duì)未來(lái)的愿景。2017年網(wǎng)易已經(jīng)開(kāi)始對(duì)外商業(yè)化,但是并沒(méi)有全面鋪開(kāi)而是選擇重點(diǎn)合作伙伴。”
網(wǎng)易是一家重視交互的公司。丁磊說(shuō)過(guò)一句代表公司文化的話:“好的交互就是沒(méi)有交互”。李曉燕本次的分享也都是圍繞“交互”來(lái)談人工智能。在她看來(lái),人工智能的發(fā)展要在人與機(jī)器之間找到一個(gè)突破點(diǎn),讓更多的人能跟科技互動(dòng),這種人人都能參與的交互比功能更有價(jià)值。
李曉燕談到,AR是一種全新的交互界面,能真正的連接物理世界和數(shù)字世界。這種新的交互界面下的內(nèi)容形式包括了視覺(jué)的增強(qiáng)、音頻的增強(qiáng)、觸覺(jué)的增強(qiáng),未來(lái)的AR交互界面是什么樣子,或許還要再等幾年才能定義?,F(xiàn)在我們看到手勢(shì)交互、語(yǔ)音交互、觸覺(jué)交互,每個(gè)交互手段都各有優(yōu)劣勢(shì),我們需要去研究如何在這幾種交互中無(wú)縫切換。AI技術(shù)是這些界面和內(nèi)容背后的算法基礎(chǔ),包括語(yǔ)音技術(shù)、視覺(jué)技術(shù)、NLP等。下一代的交互界面會(huì)增強(qiáng)我們的感官能力和認(rèn)知能力,是各大公司都在共同投入的愿景。
因此,網(wǎng)易的AI戰(zhàn)略中,AR是濃墨重彩的一筆。
網(wǎng)易AR業(yè)務(wù)線有網(wǎng)易洞見(jiàn)、網(wǎng)易影見(jiàn)兩大產(chǎn)品。網(wǎng)易洞見(jiàn)是網(wǎng)易AR團(tuán)隊(duì)自主研發(fā)的基于移動(dòng)設(shè)備的AR平臺(tái),包括三個(gè)產(chǎn)品形態(tài):網(wǎng)易洞見(jiàn)客戶端、互聯(lián)網(wǎng)應(yīng)用引擎和AR游戲引擎,支持網(wǎng)易自由的AR應(yīng)用,同時(shí)為AR開(kāi)發(fā)者賦能。網(wǎng)易影見(jiàn)是網(wǎng)易研發(fā)的增強(qiáng)現(xiàn)實(shí)互動(dòng)投影模塊,可以將任意平面轉(zhuǎn)化為顯示屏幕,實(shí)現(xiàn)觸碰交互、空中手勢(shì)、物體交互等多維度交互方式。
AR還處于發(fā)展早期,為消費(fèi)者提供豐富的內(nèi)容極為重要。網(wǎng)易的內(nèi)容研發(fā)立足于網(wǎng)易自身的游戲、電商、營(yíng)銷(xiāo)等方面。網(wǎng)易AR的代表作《悠夢(mèng)》已經(jīng)登錄ARKit、ARCore等平臺(tái)。李曉燕認(rèn)為網(wǎng)易在AR內(nèi)容研發(fā)商領(lǐng)先行業(yè)半年到一年的時(shí)間。
蘋(píng)果和網(wǎng)易一樣,同時(shí)重視AI與AR。2017年6月,蘋(píng)果在WWDC上發(fā)布ARKit,使得上億手機(jī)擁有AR體驗(yàn),點(diǎn)燃AR發(fā)展。而蘋(píng)果CEO庫(kù)克也談到,手機(jī)AR是AR發(fā)展的過(guò)渡環(huán)節(jié),AR眼鏡是更為終極的產(chǎn)品形態(tài),蘋(píng)果也將于2021年推出AR眼鏡。
網(wǎng)易也在布局AR眼鏡,2018年1月,網(wǎng)易曾與硅谷Amber工作室合作推出售價(jià)199元的插手機(jī)的HoloKit眼鏡盒子,網(wǎng)易特意成立了HoloKit創(chuàng)新實(shí)驗(yàn)室。
2018年,網(wǎng)易AI平臺(tái)對(duì)外開(kāi)放,平臺(tái)包括圖像處理、語(yǔ)音語(yǔ)言、數(shù)據(jù)智能等多項(xiàng)AI技術(shù),提供多領(lǐng)域全套解決方案。
在語(yǔ)音語(yǔ)言方面,網(wǎng)易推出了“網(wǎng)易見(jiàn)外”,其是國(guó)內(nèi)首款基于神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯NMT技術(shù),集視頻聽(tīng)翻、直播聽(tīng)翻、語(yǔ)音轉(zhuǎn)寫(xiě)、文檔直翻功能為一體的AI智能語(yǔ)音轉(zhuǎn)寫(xiě)聽(tīng)翻平臺(tái)。
雷鋒網(wǎng)曾詳細(xì)介紹過(guò)網(wǎng)易子公司網(wǎng)易有道的AI戰(zhàn)略,語(yǔ)音識(shí)別、翻譯都是有道的核心AI能力,目前有道也有自己的AI開(kāi)放平臺(tái),賦能B端,網(wǎng)易有道目前主要有教育、政企、智能硬件極大核心場(chǎng)景,與網(wǎng)易沒(méi)有直接沖突。
李曉燕談到,目前網(wǎng)易有道的語(yǔ)音識(shí)別服務(wù)端調(diào)用的是網(wǎng)易的,神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)也是網(wǎng)易率先突破。
雷鋒網(wǎng)好奇,BAT也在做全開(kāi)放的AI平臺(tái),希望能通過(guò)AI平臺(tái),輸出AI技術(shù)能力賦能B端,成為AI時(shí)代的帶隊(duì)者。作為第二梯隊(duì)的互聯(lián)網(wǎng)巨頭公司,網(wǎng)易的AI平臺(tái)與BAT有什么不同呢?
李曉燕談到,網(wǎng)易是一家C端公司,在AI時(shí)代也在沉淀B端能力。目前,網(wǎng)易AI平臺(tái)主要服務(wù)于網(wǎng)易全系產(chǎn)品,對(duì)外是開(kāi)放平臺(tái),但是與BAT不同的是,網(wǎng)易還提供深度定制,團(tuán)隊(duì)內(nèi)部有一部分的成員會(huì)支持客戶做深度定制的AI項(xiàng)目。
耕耘AI七年,以產(chǎn)品和交互為核心的網(wǎng)易,還沒(méi)打算喊出all in AI的口號(hào)。不過(guò)從這次的交流會(huì)看來(lái),網(wǎng)易也已經(jīng)展開(kāi)了全方位的布局。未來(lái)的交互界面,或許會(huì)有一部分的想象力來(lái)自網(wǎng)易。
相關(guān)文章:
詳解網(wǎng)易有道AI戰(zhàn)略,智能硬件、教育、辦公三大解決方案
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。