0
雷鋒網 AI 科技評論按:前不久,科大訊飛宣布曾任微軟亞洲研究院副院長、硬蛋科技 CTO 的李世鵬博士正式加盟科大訊飛,擔任科大訊飛副總裁、訊飛 AI 研究院聯(lián)席院長,并稱「李世鵬博士將領導科大訊飛研究團隊在人工智能核心技術上的探索和創(chuàng)新,助力科大訊飛的 AI 技術應用落地,并主導科大訊飛的國際技術合作拓展。」(《前MSRA副院長李世鵬加入科大訊飛,任訊飛 AI 研究院聯(lián)席院長》)
這不免讓人感到些許詫異。科大訊飛作為一家在語音和自然語言研究具有雄厚科研實力的企業(yè),為何要引入在計算機視覺領域享有盛譽的李世鵬博士呢?李世鵬博士又為何選擇科大訊飛?他將在科大訊飛研究院發(fā)揮什么樣的作用?
雷鋒網就此來到訊飛北京總部拜訪了科大訊飛副總裁、訊飛 AI 研究院聯(lián)席院長李世鵬博士,并就相關問題,對李世鵬博士進行采訪。以下為采訪內容,做了不改變原意的調整和編輯。近期科大訊飛在 IDRiD 眼底圖分析競賽、SQuAD 挑戰(zhàn)賽均取得優(yōu)異成績,加上引入李世鵬博士擔任訊飛 AI 研究院聯(lián)席院長,在雷鋒網旗下學術頻道 AI 科技評論的數(shù)據(jù)庫項目「AI影響因子」中有突出表現(xiàn)。
李世鵬,IEEE Fellow,新一代人工智能產業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟聯(lián)合秘書長。在加盟科大訊飛之前,為硬蛋科技 CTO,創(chuàng)立了硬蛋實驗室;在此之前,從 1999 年至 2015 年間任微軟亞洲研究院首席研究員、副院長、微軟公司合伙人,為微軟亞洲研究院共同創(chuàng)始人之一。作為《IEEE 電路與系統(tǒng)會刊-視頻技術??番F(xiàn)任總編輯 (2018-2019) 和 IEEE Fellow,李世鵬博士在多媒體、互聯(lián)網、計算機視覺、云計算及人工智能領域極具國際影響力,擁有 195 項美國專利及 330 多篇國際論文。同時,李博士培養(yǎng)出四位 MIT TR35 創(chuàng)新獎的獲得者(《麻省理工科技評論》「全球 35 位 35 歲以下科技創(chuàng)新青年」),目前擔任微軟亞洲研究院院友會秘書長。
李世鵬:我在硬蛋工作大概有兩年半時間,主要負責人工智能使能平臺——Kepler 系統(tǒng)(K-系統(tǒng))的搭建,去年 5 月份這個平臺已經發(fā)布,可以說基本的技術框架已經完成,研發(fā)方面的工作已經不是太多,剩下的主要就是一些技術落地方面的工作了。這個不是我所擅長的,所以現(xiàn)在硬蛋實驗室由首席架構師苑貴強博士負責,我擔任技術顧問。
李世鵬:總的來說,我在微軟做研究,然后到硬蛋做產品,現(xiàn)在是回來繼續(xù)做研究。
當時我從微軟出來,是想給自己留一段時間對中國整個技術生態(tài)做一個完整的了解,硬蛋科技對我來說是一個很好的平臺,給我一個機會了解中國產業(yè)的趨勢、痛點以及他們亟待解決的問題;同時,我也幫助硬蛋將研發(fā)團隊和能力給帶動了起來。這兩年多的時間里,我確實學了很多東西?,F(xiàn)在我加入科大訊飛,再次回到研究領域,也是帶著一些實際中需要解決的問題的。所以整個大方向就是回到自己比較擅長的研究領域。
李世鵬:國內研究機構很多,但是要看哪個平臺更適合發(fā)揮自己的研究特長。我覺得有很多因素促成了這樣一件事。首先,我本身是中科大畢業(yè)的,而科大訊飛也是出身于中科大,同根同源,彼此之間文化、交流、理念都特別相近。其次,科大訊飛是一家以技術為主導的公司,大部分人員屬于技術人員,他們在技術研發(fā)方面投入了很多資源,這是我特別欣賞的。另外一個原因是,科大訊飛是做語音的公司,我本身是做圖像和計算機視覺這塊兒的,對語音不太熟悉,所以我加入訊飛正好是一個強強聯(lián)合。我會把很多做視覺的資源帶到公司,用我的經驗和技術背景來增強公司在視覺方面的研發(fā)能力。
李世鵬:這個時間其實蠻長了。去年在蘇州的一次創(chuàng)業(yè)會議上,訊飛研究院的胡國平院長和我都去做了演講。在這個會上我們建立了聯(lián)系,他問我:“有沒有想過訊飛的機會?”不過我當時真沒想過。
訊飛一直以來都是我心目中比較佩服的公司,我記得訊飛的董事長劉慶峰是歷史上唯一一個拒掉微軟獎學金的人。他說當時在創(chuàng)業(yè),真的沒有時間去拿微軟獎學金。從那個時候起,我就對訊飛比較關注了。但是也只是遠望,知道訊飛語音做的好,近幾年在語義、機器翻譯等方面做的也特別好,但是最近在做什么卻并不是特別了解。
后來,胡國平院長深入地給我介紹了公司的方向;然后在今年年初,我和劉慶峰董事長也詳細聊了聊。他講,訊飛未來的產品其實定位很清晰,就是抓住人類社會的三個剛需:教育、醫(yī)療和司法;這三個剛需(雷鋒網注:訊飛稱為「賽道」)會把人工智能所有的技術都串起來。我覺得挺受啟發(fā),同時我也覺得這里面有很多需要深入研究的地方,我過來后會有很多空間施展自己的才華。
李世鵬:由于現(xiàn)在人工智能技術的普及,現(xiàn)在的人工智能公司,已經不可能靠一個技術打遍天下了,所以總的趨勢都是往全棧方向發(fā)展。當技術不強的時候,你可以和其他公司在技術上進行合作,以彌補自己的技術短缺;但是當越做越好的時候,就需要建立自己的核心技術了,這樣才能在做大項目時不求于人。訊飛目前走的是平臺+賽道的路線,而賽道所需要的不是單一的技術,而是全棧的技術。訊飛在語音、NLP 等領域在業(yè)界做的非常頂尖;我希望加入訊飛之后能把視覺這一塊也同樣帶起來。
李世鵬:其實訊飛在視覺方面的研究已經很強了,包括文字識別、醫(yī)療等方面,其實都有產品。如果你記得的話,訊飛去年在 LUNA 的比賽中獲得了平均召回率 94.1% 的檢測效果,刷新了世界紀錄。
從某種意義上來講,現(xiàn)在人工智能(包括視覺)能不能做好,關鍵取決于有沒有足夠的標注好的數(shù)據(jù)。很多公司只是在拿一些標準的訓練集、測試集在做;但真正到實際應用時,還必須得采集足夠多的真實數(shù)據(jù)集。訊飛在數(shù)據(jù)這一塊花了很多資源,包括請一些專業(yè)的醫(yī)生來標注醫(yī)學影像等,這個力度是我在其他公司見得比較少的。這也是我加入訊飛的原因之一。
李世鵬:我說一下我個人的觀點。完全靠大數(shù)據(jù)的方法有其局限性;但是在技術突破之前,大家拼的只能是數(shù)據(jù),所以你必須在數(shù)據(jù)上下功夫。
我們意識到未來不會是完全依靠大數(shù)據(jù)驅動,所以我們不會完全停止在以大數(shù)據(jù)為基礎的技術研究之上。這也是為什么我們會跟世界上最好的學校、研究所去合作,就是要去發(fā)現(xiàn)將來的人工智能是什么樣的架構,什么樣的新模式,是否可以從認知科學里面得到啟發(fā),是否可以靠知識或推理來補全等。這些也是我比較感興趣的,即 what beyond 大數(shù)據(jù)+深度學習。把推理、知識的東西融入到人工智能當中,即使沒有大數(shù)據(jù)也能把機器變得更智能。所以你這個問題問地特別好,我也正在看這方面的東西。但是現(xiàn)階段要想往前走,還是得拼數(shù)據(jù)。
李世鵬:首先,訊飛現(xiàn)在有一個 60 多人的團隊在做視覺,但視覺里面需要做的東西太多了,所以我們想隨后將這個團隊加強和擴大。另外,我們也有計劃在北京跟一些研究所、高校進行深度合作,或者在北京建立一個計算機視覺的團隊。
在研究方面,一方面我們仍然會和其他公司一樣,繼續(xù)用現(xiàn)在大數(shù)據(jù)的方式,解決現(xiàn)在的問題。另一方面,我們更多的還得看將來,例如 3 - 5 年,人工智能技術會發(fā)展到什么樣的地步?我們從現(xiàn)在開始就做一些技術儲備,等真正時機來臨的時候,就游刃有余了。因此在研究方向上,我們從一開始就會做一些結合認知科學方法+大數(shù)據(jù)方法的研究。
李世鵬:不管是從市場還是技術合作商,今年都是訊飛真正正式進入國際的一年,我們追求的目標也更大更遠。市場上,包括在今年 CES 大會上,我們也去展示了我們的產品;我們的翻譯機在美國市場上已經開賣,目前很受歡迎。在合作上,我們的董事長劉慶峰今年親自帶隊,下定決心跟美國很多高校展開正式合作,包括 MIT、斯坦福、伯克利等高校都在談。
李世鵬:我本身曾是從跨國公司出來的,同時也在學術圈接觸許多世界各地的教授。所以在訊飛這個平臺上,我可以與他們建立一些新的聯(lián)系和合作,這是一個很自然的工作?,F(xiàn)在這項工作已經開展,而且還不錯。
李世鵬:國際化是一個主要方向;但視覺只是很多技術的方向之一,準確來講是向人工智能的全面化進軍。不過我們沒有想那么高調,想先踏踏實實做事,完了之后再說,這是訊飛的風格,也是我特別喜歡訊飛的地方。
相關文章:
前MSRA副院長李世鵬加入科大訊飛,任訊飛 AI 研究院聯(lián)席院長
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。