0
本文作者: camel | 2018-05-15 18:42 |
雷鋒網(wǎng) AI 科技評(píng)論按:前不久,科大訊飛宣布曾任微軟亞洲研究院副院長(zhǎng)、硬蛋科技 CTO 的李世鵬博士正式加盟科大訊飛,擔(dān)任科大訊飛副總裁、訊飛 AI 研究院聯(lián)席院長(zhǎng),并稱「李世鵬博士將領(lǐng)導(dǎo)科大訊飛研究團(tuán)隊(duì)在人工智能核心技術(shù)上的探索和創(chuàng)新,助力科大訊飛的 AI 技術(shù)應(yīng)用落地,并主導(dǎo)科大訊飛的國(guó)際技術(shù)合作拓展。」(《前MSRA副院長(zhǎng)李世鵬加入科大訊飛,任訊飛 AI 研究院聯(lián)席院長(zhǎng)》)
這不免讓人感到些許詫異??拼笥嶏w作為一家在語(yǔ)音和自然語(yǔ)言研究具有雄厚科研實(shí)力的企業(yè),為何要引入在計(jì)算機(jī)視覺領(lǐng)域享有盛譽(yù)的李世鵬博士呢?李世鵬博士又為何選擇科大訊飛?他將在科大訊飛研究院發(fā)揮什么樣的作用?
雷鋒網(wǎng)就此來(lái)到訊飛北京總部拜訪了科大訊飛副總裁、訊飛 AI 研究院聯(lián)席院長(zhǎng)李世鵬博士,并就相關(guān)問(wèn)題,對(duì)李世鵬博士進(jìn)行采訪。以下為采訪內(nèi)容,做了不改變?cè)獾恼{(diào)整和編輯。近期科大訊飛在 IDRiD 眼底圖分析競(jìng)賽、SQuAD 挑戰(zhàn)賽均取得優(yōu)異成績(jī),加上引入李世鵬博士擔(dān)任訊飛 AI 研究院聯(lián)席院長(zhǎng),在雷鋒網(wǎng)旗下學(xué)術(shù)頻道 AI 科技評(píng)論的數(shù)據(jù)庫(kù)項(xiàng)目「AI影響因子」中有突出表現(xiàn)。
李世鵬,IEEE Fellow,新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟聯(lián)合秘書長(zhǎng)。在加盟科大訊飛之前,為硬蛋科技 CTO,創(chuàng)立了硬蛋實(shí)驗(yàn)室;在此之前,從 1999 年至 2015 年間任微軟亞洲研究院首席研究員、副院長(zhǎng)、微軟公司合伙人,為微軟亞洲研究院共同創(chuàng)始人之一。作為《IEEE 電路與系統(tǒng)會(huì)刊-視頻技術(shù)專刊》現(xiàn)任總編輯 (2018-2019) 和 IEEE Fellow,李世鵬博士在多媒體、互聯(lián)網(wǎng)、計(jì)算機(jī)視覺、云計(jì)算及人工智能領(lǐng)域極具國(guó)際影響力,擁有 195 項(xiàng)美國(guó)專利及 330 多篇國(guó)際論文。同時(shí),李博士培養(yǎng)出四位 MIT TR35 創(chuàng)新獎(jiǎng)的獲得者(《麻省理工科技評(píng)論》「全球 35 位 35 歲以下科技創(chuàng)新青年」),目前擔(dān)任微軟亞洲研究院院友會(huì)秘書長(zhǎng)。
李世鵬:我在硬蛋工作大概有兩年半時(shí)間,主要負(fù)責(zé)人工智能使能平臺(tái)——Kepler 系統(tǒng)(K-系統(tǒng))的搭建,去年 5 月份這個(gè)平臺(tái)已經(jīng)發(fā)布,可以說(shuō)基本的技術(shù)框架已經(jīng)完成,研發(fā)方面的工作已經(jīng)不是太多,剩下的主要就是一些技術(shù)落地方面的工作了。這個(gè)不是我所擅長(zhǎng)的,所以現(xiàn)在硬蛋實(shí)驗(yàn)室由首席架構(gòu)師苑貴強(qiáng)博士負(fù)責(zé),我擔(dān)任技術(shù)顧問(wèn)。
李世鵬:總的來(lái)說(shuō),我在微軟做研究,然后到硬蛋做產(chǎn)品,現(xiàn)在是回來(lái)繼續(xù)做研究。
當(dāng)時(shí)我從微軟出來(lái),是想給自己留一段時(shí)間對(duì)中國(guó)整個(gè)技術(shù)生態(tài)做一個(gè)完整的了解,硬蛋科技對(duì)我來(lái)說(shuō)是一個(gè)很好的平臺(tái),給我一個(gè)機(jī)會(huì)了解中國(guó)產(chǎn)業(yè)的趨勢(shì)、痛點(diǎn)以及他們亟待解決的問(wèn)題;同時(shí),我也幫助硬蛋將研發(fā)團(tuán)隊(duì)和能力給帶動(dòng)了起來(lái)。這兩年多的時(shí)間里,我確實(shí)學(xué)了很多東西?,F(xiàn)在我加入科大訊飛,再次回到研究領(lǐng)域,也是帶著一些實(shí)際中需要解決的問(wèn)題的。所以整個(gè)大方向就是回到自己比較擅長(zhǎng)的研究領(lǐng)域。
李世鵬:國(guó)內(nèi)研究機(jī)構(gòu)很多,但是要看哪個(gè)平臺(tái)更適合發(fā)揮自己的研究特長(zhǎng)。我覺得有很多因素促成了這樣一件事。首先,我本身是中科大畢業(yè)的,而科大訊飛也是出身于中科大,同根同源,彼此之間文化、交流、理念都特別相近。其次,科大訊飛是一家以技術(shù)為主導(dǎo)的公司,大部分人員屬于技術(shù)人員,他們?cè)诩夹g(shù)研發(fā)方面投入了很多資源,這是我特別欣賞的。另外一個(gè)原因是,科大訊飛是做語(yǔ)音的公司,我本身是做圖像和計(jì)算機(jī)視覺這塊兒的,對(duì)語(yǔ)音不太熟悉,所以我加入訊飛正好是一個(gè)強(qiáng)強(qiáng)聯(lián)合。我會(huì)把很多做視覺的資源帶到公司,用我的經(jīng)驗(yàn)和技術(shù)背景來(lái)增強(qiáng)公司在視覺方面的研發(fā)能力。
李世鵬:這個(gè)時(shí)間其實(shí)蠻長(zhǎng)了。去年在蘇州的一次創(chuàng)業(yè)會(huì)議上,訊飛研究院的胡國(guó)平院長(zhǎng)和我都去做了演講。在這個(gè)會(huì)上我們建立了聯(lián)系,他問(wèn)我:“有沒(méi)有想過(guò)訊飛的機(jī)會(huì)?”不過(guò)我當(dāng)時(shí)真沒(méi)想過(guò)。
訊飛一直以來(lái)都是我心目中比較佩服的公司,我記得訊飛的董事長(zhǎng)劉慶峰是歷史上唯一一個(gè)拒掉微軟獎(jiǎng)學(xué)金的人。他說(shuō)當(dāng)時(shí)在創(chuàng)業(yè),真的沒(méi)有時(shí)間去拿微軟獎(jiǎng)學(xué)金。從那個(gè)時(shí)候起,我就對(duì)訊飛比較關(guān)注了。但是也只是遠(yuǎn)望,知道訊飛語(yǔ)音做的好,近幾年在語(yǔ)義、機(jī)器翻譯等方面做的也特別好,但是最近在做什么卻并不是特別了解。
后來(lái),胡國(guó)平院長(zhǎng)深入地給我介紹了公司的方向;然后在今年年初,我和劉慶峰董事長(zhǎng)也詳細(xì)聊了聊。他講,訊飛未來(lái)的產(chǎn)品其實(shí)定位很清晰,就是抓住人類社會(huì)的三個(gè)剛需:教育、醫(yī)療和司法;這三個(gè)剛需(雷鋒網(wǎng)注:訊飛稱為「賽道」)會(huì)把人工智能所有的技術(shù)都串起來(lái)。我覺得挺受啟發(fā),同時(shí)我也覺得這里面有很多需要深入研究的地方,我過(guò)來(lái)后會(huì)有很多空間施展自己的才華。
李世鵬:由于現(xiàn)在人工智能技術(shù)的普及,現(xiàn)在的人工智能公司,已經(jīng)不可能靠一個(gè)技術(shù)打遍天下了,所以總的趨勢(shì)都是往全棧方向發(fā)展。當(dāng)技術(shù)不強(qiáng)的時(shí)候,你可以和其他公司在技術(shù)上進(jìn)行合作,以彌補(bǔ)自己的技術(shù)短缺;但是當(dāng)越做越好的時(shí)候,就需要建立自己的核心技術(shù)了,這樣才能在做大項(xiàng)目時(shí)不求于人。訊飛目前走的是平臺(tái)+賽道的路線,而賽道所需要的不是單一的技術(shù),而是全棧的技術(shù)。訊飛在語(yǔ)音、NLP 等領(lǐng)域在業(yè)界做的非常頂尖;我希望加入訊飛之后能把視覺這一塊也同樣帶起來(lái)。
李世鵬:其實(shí)訊飛在視覺方面的研究已經(jīng)很強(qiáng)了,包括文字識(shí)別、醫(yī)療等方面,其實(shí)都有產(chǎn)品。如果你記得的話,訊飛去年在 LUNA 的比賽中獲得了平均召回率 94.1% 的檢測(cè)效果,刷新了世界紀(jì)錄。
從某種意義上來(lái)講,現(xiàn)在人工智能(包括視覺)能不能做好,關(guān)鍵取決于有沒(méi)有足夠的標(biāo)注好的數(shù)據(jù)。很多公司只是在拿一些標(biāo)準(zhǔn)的訓(xùn)練集、測(cè)試集在做;但真正到實(shí)際應(yīng)用時(shí),還必須得采集足夠多的真實(shí)數(shù)據(jù)集。訊飛在數(shù)據(jù)這一塊花了很多資源,包括請(qǐng)一些專業(yè)的醫(yī)生來(lái)標(biāo)注醫(yī)學(xué)影像等,這個(gè)力度是我在其他公司見得比較少的。這也是我加入訊飛的原因之一。
李世鵬:我說(shuō)一下我個(gè)人的觀點(diǎn)。完全靠大數(shù)據(jù)的方法有其局限性;但是在技術(shù)突破之前,大家拼的只能是數(shù)據(jù),所以你必須在數(shù)據(jù)上下功夫。
我們意識(shí)到未來(lái)不會(huì)是完全依靠大數(shù)據(jù)驅(qū)動(dòng),所以我們不會(huì)完全停止在以大數(shù)據(jù)為基礎(chǔ)的技術(shù)研究之上。這也是為什么我們會(huì)跟世界上最好的學(xué)校、研究所去合作,就是要去發(fā)現(xiàn)將來(lái)的人工智能是什么樣的架構(gòu),什么樣的新模式,是否可以從認(rèn)知科學(xué)里面得到啟發(fā),是否可以靠知識(shí)或推理來(lái)補(bǔ)全等。這些也是我比較感興趣的,即 what beyond 大數(shù)據(jù)+深度學(xué)習(xí)。把推理、知識(shí)的東西融入到人工智能當(dāng)中,即使沒(méi)有大數(shù)據(jù)也能把機(jī)器變得更智能。所以你這個(gè)問(wèn)題問(wèn)地特別好,我也正在看這方面的東西。但是現(xiàn)階段要想往前走,還是得拼數(shù)據(jù)。
李世鵬:首先,訊飛現(xiàn)在有一個(gè) 60 多人的團(tuán)隊(duì)在做視覺,但視覺里面需要做的東西太多了,所以我們想隨后將這個(gè)團(tuán)隊(duì)加強(qiáng)和擴(kuò)大。另外,我們也有計(jì)劃在北京跟一些研究所、高校進(jìn)行深度合作,或者在北京建立一個(gè)計(jì)算機(jī)視覺的團(tuán)隊(duì)。
在研究方面,一方面我們?nèi)匀粫?huì)和其他公司一樣,繼續(xù)用現(xiàn)在大數(shù)據(jù)的方式,解決現(xiàn)在的問(wèn)題。另一方面,我們更多的還得看將來(lái),例如 3 - 5 年,人工智能技術(shù)會(huì)發(fā)展到什么樣的地步?我們從現(xiàn)在開始就做一些技術(shù)儲(chǔ)備,等真正時(shí)機(jī)來(lái)臨的時(shí)候,就游刃有余了。因此在研究方向上,我們從一開始就會(huì)做一些結(jié)合認(rèn)知科學(xué)方法+大數(shù)據(jù)方法的研究。
李世鵬:不管是從市場(chǎng)還是技術(shù)合作商,今年都是訊飛真正正式進(jìn)入國(guó)際的一年,我們追求的目標(biāo)也更大更遠(yuǎn)。市場(chǎng)上,包括在今年 CES 大會(huì)上,我們也去展示了我們的產(chǎn)品;我們的翻譯機(jī)在美國(guó)市場(chǎng)上已經(jīng)開賣,目前很受歡迎。在合作上,我們的董事長(zhǎng)劉慶峰今年親自帶隊(duì),下定決心跟美國(guó)很多高校展開正式合作,包括 MIT、斯坦福、伯克利等高校都在談。
李世鵬:我本身曾是從跨國(guó)公司出來(lái)的,同時(shí)也在學(xué)術(shù)圈接觸許多世界各地的教授。所以在訊飛這個(gè)平臺(tái)上,我可以與他們建立一些新的聯(lián)系和合作,這是一個(gè)很自然的工作?,F(xiàn)在這項(xiàng)工作已經(jīng)開展,而且還不錯(cuò)。
李世鵬:國(guó)際化是一個(gè)主要方向;但視覺只是很多技術(shù)的方向之一,準(zhǔn)確來(lái)講是向人工智能的全面化進(jìn)軍。不過(guò)我們沒(méi)有想那么高調(diào),想先踏踏實(shí)實(shí)做事,完了之后再說(shuō),這是訊飛的風(fēng)格,也是我特別喜歡訊飛的地方。
相關(guān)文章:
前MSRA副院長(zhǎng)李世鵬加入科大訊飛,任訊飛 AI 研究院聯(lián)席院長(zhǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。