0
雷鋒網(wǎng)AI科技評論按:阿里人工智能實驗室在上個月的10月16日宣布引入兩位重量級AI人才。這兩位科學家來頭都不小,一位是微軟亞洲研究院首席研究員聶再清博士,另一位是谷歌Tango和DayDream項目技術(shù)主管李名楊博士。兩位大咖入職阿里被外界稱之為:阿里達摩院成立后打響的人才強奪戰(zhàn)第一槍。我們來看看他們自己是怎么評價的。
雷鋒網(wǎng)分別對兩位科學家作了專訪,李名楊博士專訪鏈接請點擊:獨家 | 阿里機器視覺專家李名楊:AR 是 AI 的一種體現(xiàn)方式。
阿里人工智能實驗室北京研發(fā)中心負責人聶再清博士
聶再清博士加入 AI Labs 此前在微軟亞洲研究院主要負責微軟自然語言理解、實體挖掘的研發(fā)工作。在對象級別搜索與大數(shù)據(jù)挖掘方面申請國際專利十余項。他帶領(lǐng)團隊旨在通過大數(shù)據(jù)挖掘和眾包,建立 Web-scale 知識圖譜,是微軟學術(shù)搜索、人立方,以及企業(yè)智能助理 EDI 的發(fā)起人和負責人,也是微軟自然語言理解平臺LUIS的技術(shù)負責人。相關(guān)技術(shù)已經(jīng)應(yīng)用在 Bing、Office、Cortana 等產(chǎn)品上。
加入阿里 AI Labs 之后,他除了負責北京研發(fā)中心的各項研發(fā)工作外,還將重點突破知識圖譜和自然語言理解這兩個研究方向。
筆者在采訪之前,了解到聶再清博士已在微軟工作了十三年,想必這次入職阿里也是下了很大的決心和勇氣。聶博士在采訪中也透漏出了對微軟的難舍之情。他說:“微軟就像一個大家庭一樣,讓我學習了很多,成長了很多,在離職的最后一刻,還是很不舍。”
聶博士談到,這次加盟阿里主要原因還是很多思維理念和阿里相一致,很認同阿里達摩院做研究的方式。在阿里人工智能實驗室有可能把一件事情從一個研究做到一個真正有影響力的,影響千家萬戶的實用產(chǎn)品,這一點對他來說非常具有吸引力。
微軟給研究者提供更多的是基于興趣做研究,阿里人工智能實驗室對研究者的要求主要是基于產(chǎn)品的需求并結(jié)合研究興趣做研究。聶再清博士表示這兩者并不沖突,今后在阿里主要負責的兩個突破方向是知識圖譜和自然語言理解,這是他在博士期間就開始從事的,也是他的興趣所在。如果是站在阿里的角度思考,也不會讓他做自己不感興趣的研究,這對于企業(yè)也不是利益最大化。
做算法出身,卻認為數(shù)據(jù)比算法重要。算法、數(shù)據(jù)、算力到底哪個最重要,一般的回答者都認為自己做的那個最重要,而帶領(lǐng)團隊做算法的聶博士認為數(shù)據(jù)比算法重要?!皵?shù)據(jù)能充分利用的話,其實可以用相對簡單的算法就能達到很好的效果?!彼f道。值得一提的是,馬云也多次在公開場合表達過“數(shù)據(jù)比算法重要”的類似觀點,聶博士在得知自己對這一問題的看法和馬云演講中所講的觀點高度一致后,感到非常開心。思維理念與阿里又一次接軌,使得聶博士對未來的研究也充滿了信心與期待。
除此之外,聶再清博士還對于筆者提出的關(guān)于目前知識圖譜建立的難點,以及自然語言理解面臨的挑戰(zhàn)等問題給出了詳細的解答。以下是雷鋒網(wǎng)的專訪內(nèi)容。
一、過去的十三年里,您為什么一直堅持在微軟做研究?
聶再清:微軟就像一個大家庭一樣,我學習了很多,成長了很多。包括在離職的最后一刻都很難過,覺得很不舍。
在微軟做研究確實是一個很好的地方,但我有一點是想把一件事情從研究階段一直推到產(chǎn)品,想把它的影響力做出來。我在微軟主要做了這幾件事情,學術(shù)搜索,人立方,包括在微軟時做的最后一個產(chǎn)品 (LUIS) 這些項目我覺得在研究這一層已經(jīng)很好了,很多人都知道,也有很多人在用,但是還沒有變成特別有影響力的(路人皆知的)產(chǎn)品。
我到阿里來,是覺得現(xiàn)在人工智能實驗室有這么一個機會,有可能把一件事情從一個研究做成一個真正影響到千家萬戶的實用的產(chǎn)品。我認為做研究在微軟研究院還是很好的,但每個人的追求不同,其實我在研究院也不是最典型的發(fā)論文的研究員,我一直是以把一件事情做出來這樣的方式來做研究。我更多是希望做一個創(chuàng)新產(chǎn)品時,在做的過程中能及時拿到別人的反饋,再形成新的解決方案,形成新的創(chuàng)新,按照這個思路把這樣的創(chuàng)新一步一步去迭代。我在微軟亞洲研究院也都是這樣一個思路做研究。在我們以前沈向洋當院長時,把這個叫做(deployment-driven research)拿到用戶的反饋去做研究。
二、為什么選擇在這個時機加入阿里,和阿里達摩院成立有關(guān)系嗎?
聶再清:阿里改變了很多人的生活方式,是一個很落地的公司。我很崇拜馬老師(馬云),他在做有用又很有趣的事兒。另外我和阿里人工智能實驗室的淺雪(花名)談的很默契,我覺得在這里可以把我的一些想法做成真正影響很多人生活的一個東西。達摩院是我決定來阿里之后成立的,達摩院做研究的方式,我是很認同的。
三、基于興趣做研究和基于產(chǎn)品需求做研究,您認為哪一個好?
聶再清:我覺得兩者不違背。首先,我不會去做一個我不感興趣的研究,我在微軟所做的事情和在這里做的是相關(guān)聯(lián)的,并不是毫無關(guān)系的。我原來的興趣愛好或原來的想法,在這里能夠擴大,能更快速的實現(xiàn)。如果站在公司的角度,如果公司讓我做一個我不太感興趣的事兒,對公司也不是最大的利益訴求。我覺得這兩點可以搭配的很好。
四、阿里AI Labs,總體可分為終端實驗室和算法實驗室,您主要負責哪一塊兒?能具體談?wù)剢幔?/span>
聶再清:我所帶領(lǐng)的團隊是偏算法研究。主要負責兩個,知識圖譜和自然語言理解。這跟我以前在微軟所做的事情一直都是分不開的,包括我在博士期間,都是可以連起來的。我在博士期間做了一個學術(shù)搜索,當時并沒有把所有數(shù)據(jù)都集成起來,建成由實體關(guān)系連接的知識圖譜形式,這個形式是在微軟以后,我才慢慢提出來的。我來微軟的第一個項目就是微軟的學術(shù)搜索,這個在05年就發(fā)布了,我一直在微軟做的事兒還是知識圖譜的建立,包括后來的人立方;LUIS,基于知識圖譜怎樣去做語言理解,把自然語言中的一句話對應(yīng)到知識圖譜上的一個實體ID(唯一標識號)上,比如說,一個用戶說“播放馬云的歌”,自然語言理解的一個很重要的工作就是把用戶提到的字符串“馬云”對應(yīng)到知識圖譜上的一個具體的人物ID上去 。我在做的一直是建立知識圖譜,然后把自然語言映射(map)到知識圖譜中,因為具體到了知識圖譜中的ID了,才能做一個聊天機器人,才能去執(zhí)行,否則只是字符串,字符串是無法執(zhí)行的。我到阿里人工智能實驗室,還是建立知識圖譜,還是做自然語言理解,還是把自然語言理解放到知識圖譜中的ID上。要和用戶自然交互,一定要理解用戶這句話什么意思,這句話中有什么意圖,意圖中有哪些實體,比如“杭州明天天氣怎么樣?”,意圖就是天氣預報,杭州和明天都必須對應(yīng)到可唯一識別的實體ID上去。
我做的知識圖譜和自然語言理解是連在一起的。
五、目前自然語言理解有哪些比較難的問題嗎?
聶再清:最難的問題是自然語言的多樣性和它的歧義性。比如問天氣怎么樣,有太多種問法了。比如,明天會下雨嗎?明天能出去玩嗎?明天天氣怎么樣?明天天晴嗎?有太多這種多樣性。歧義性也是,比如說一個地名,有的時候一個詞代表不同的意思,你怎么把它變成一個意圖,一個ID。我感覺自然語言理解是人工智能最難的一環(huán),是真正觸碰到智能了。我希望和廣大開發(fā)者們一起建立一個很好的生態(tài)系統(tǒng),把一個個技能都建立的很好,一起建立一個很好的自然語言交互開發(fā)者平臺和一個智能的語音交互入口。
六、自然語言理解還有一個難點是多輪對話。您怎么看待這個?
聶再清:對的,比如你根據(jù)用戶說出的一個東西,基于我們的意圖識別和實體抽?。╯lot filling)結(jié)果,確定機器現(xiàn)在的狀態(tài)和要做的下一個動作(或給用戶的一個回復):可能下一步是要去查某網(wǎng)站(或一個第三方提供的API接口),然后再把網(wǎng)站的結(jié)果返回給用戶,讓用戶再確認。這個在學術(shù)圈里叫對話管理(dialog manager)確實很有挑戰(zhàn)性,我們正在嘗試深度強化學習的方法,怎么能夠讓機器跟這個環(huán)境去交互,怎么通過自己去學習。
七、您所帶領(lǐng)的團隊都為阿里人工智能實驗室提供哪些技術(shù)支撐?
聶再清:有很多:比如意圖的理解,實體的抽取,也包括對話管理,還有知識圖譜這一塊兒。技術(shù)團隊會支撐產(chǎn)品中很多具體的、需要實現(xiàn)的東西。我很喜歡反饋,從產(chǎn)品經(jīng)理那里得到的反饋會給我很好的指導。終端團隊,技術(shù)團隊以及其他各個人工智能實驗室之間聯(lián)系也都很緊密。
八、剛您談到了自然語言處理的難點,可否給我們談?wù)勚R圖譜面臨哪些技術(shù)挑戰(zhàn)?
聶再清:知識圖譜所面臨的挑戰(zhàn)主要來自于知識圖譜的構(gòu)建與學習以及知識的表示與推理這兩個方面。其中知識圖譜的構(gòu)建與學習中的最主要的難點是,判斷兩個不同語境或不同圖譜中提到的實體是不是同一個實體。中國有幾十萬個張磊,同名,重名的問題,這兩個人是不是同一個,該不該融合在一起,怎么能把每個張磊的信息都正確地匹配到知識圖譜中的對應(yīng)實體中去呢。如果是產(chǎn)品的話,很多不同的東西,到底是不是同一個實體,比如iPhone 6、 iPhone plus、iPhone 6 金色等等。關(guān)于實體之間的關(guān)系圖,我其實不喜歡別人說我這個知識圖譜有多少條知識。其實知識圖譜里面關(guān)鍵在于有多少高精度的知識。
把一些非結(jié)構(gòu)數(shù)據(jù),多結(jié)構(gòu)數(shù)據(jù),或者結(jié)構(gòu)化數(shù)據(jù),糅合成一個,變成一張大圖。如果是從非結(jié)構(gòu)數(shù)據(jù)變成結(jié)構(gòu)化數(shù)據(jù),然后把它融進來,這是個抽取的過程,也是個理解的過程,比如,通過讀紅樓夢,把里面的人物建立一個關(guān)系圖,其實就是理解自然語言,好處在于這個人物關(guān)系圖可能在某個數(shù)據(jù)庫已經(jīng)有了,難點是怎樣把新抽取出來的實體信息和他們的關(guān)系正確地加到已有知識圖譜中去。
知識圖譜的構(gòu)建與學習中遇到的難點本質(zhì)上是由自然語言中的多樣性和歧義性帶來的。知識的表示和推理方面也有很多挑戰(zhàn),由于時間關(guān)系今天就不多講了。
九、高精度知識,需要做大數(shù)據(jù)挖掘,您認為算法重要還是數(shù)據(jù)重要?
聶再清:我個人覺得,數(shù)據(jù)重要。如果數(shù)據(jù)能充分利用的話,我可以用相對簡單的算法就能達到很好的效果。不是說不要算法,但不是單靠算法的突破,就可以把一個難題解決。我原來在微軟研究院的時候,創(chuàng)建了大數(shù)據(jù)挖掘組,我一直認為數(shù)據(jù)是很重要的。
十、加入阿里后,有什么新的體驗?
聶再清:加入剛一個多月的時間,感覺各部門之間的聯(lián)系都很緊密,工作節(jié)奏比較快,大家都很接地氣(對用戶反饋都非常重視)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。