丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給楊文
發(fā)送

0

專訪阿里聶再清:微軟十三年老兵,為何選擇加盟了阿里?

本文作者: 楊文 2017-11-21 18:03
導(dǎo)語:微軟十三年老兵,為何選擇加盟了阿里?

雷鋒網(wǎng)AI科技評(píng)論按:阿里人工智能實(shí)驗(yàn)室在上個(gè)月的10月16日宣布引入兩位重量級(jí)AI人才。這兩位科學(xué)家來頭都不小,一位是微軟亞洲研究院首席研究員聶再清博士,另一位是谷歌Tango和DayDream項(xiàng)目技術(shù)主管李名楊博士。兩位大咖入職阿里被外界稱之為:阿里達(dá)摩院成立后打響的人才強(qiáng)奪戰(zhàn)第一槍。我們來看看他們自己是怎么評(píng)價(jià)的。

雷鋒網(wǎng)分別對(duì)兩位科學(xué)家作了專訪,李名楊博士專訪鏈接請(qǐng)點(diǎn)擊:獨(dú)家 | 阿里機(jī)器視覺專家李名楊:AR 是 AI 的一種體現(xiàn)方式。

專訪阿里聶再清:微軟十三年老兵,為何選擇加盟了阿里?

阿里人工智能實(shí)驗(yàn)室北京研發(fā)中心負(fù)責(zé)人聶再清博士

聶再清博士加入 AI  Labs 此前在微軟亞洲研究院主要負(fù)責(zé)微軟自然語言理解、實(shí)體挖掘的研發(fā)工作。在對(duì)象級(jí)別搜索與大數(shù)據(jù)挖掘方面申請(qǐng)國(guó)際專利十余項(xiàng)。他帶領(lǐng)團(tuán)隊(duì)旨在通過大數(shù)據(jù)挖掘和眾包,建立 Web-scale 知識(shí)圖譜,是微軟學(xué)術(shù)搜索、人立方,以及企業(yè)智能助理 EDI 的發(fā)起人和負(fù)責(zé)人,也是微軟自然語言理解平臺(tái)LUIS的技術(shù)負(fù)責(zé)人。相關(guān)技術(shù)已經(jīng)應(yīng)用在 Bing、Office、Cortana 等產(chǎn)品上。

加入阿里 AI Labs 之后,他除了負(fù)責(zé)北京研發(fā)中心的各項(xiàng)研發(fā)工作外,還將重點(diǎn)突破知識(shí)圖譜和自然語言理解這兩個(gè)研究方向。

筆者在采訪之前,了解到聶再清博士已在微軟工作了十三年,想必這次入職阿里也是下了很大的決心和勇氣。聶博士在采訪中也透漏出了對(duì)微軟的難舍之情。他說:“微軟就像一個(gè)大家庭一樣,讓我學(xué)習(xí)了很多,成長(zhǎng)了很多,在離職的最后一刻,還是很不舍。”

聶博士談到,這次加盟阿里主要原因還是很多思維理念和阿里相一致,很認(rèn)同阿里達(dá)摩院做研究的方式。在阿里人工智能實(shí)驗(yàn)室有可能把一件事情從一個(gè)研究做到一個(gè)真正有影響力的,影響千家萬戶的實(shí)用產(chǎn)品,這一點(diǎn)對(duì)他來說非常具有吸引力。

微軟給研究者提供更多的是基于興趣做研究,阿里人工智能實(shí)驗(yàn)室對(duì)研究者的要求主要是基于產(chǎn)品的需求并結(jié)合研究興趣做研究。聶再清博士表示這兩者并不沖突,今后在阿里主要負(fù)責(zé)的兩個(gè)突破方向是知識(shí)圖譜和自然語言理解,這是他在博士期間就開始從事的,也是他的興趣所在。如果是站在阿里的角度思考,也不會(huì)讓他做自己不感興趣的研究,這對(duì)于企業(yè)也不是利益最大化。

做算法出身,卻認(rèn)為數(shù)據(jù)比算法重要。算法、數(shù)據(jù)、算力到底哪個(gè)最重要,一般的回答者都認(rèn)為自己做的那個(gè)最重要,而帶領(lǐng)團(tuán)隊(duì)做算法的聶博士認(rèn)為數(shù)據(jù)比算法重要?!皵?shù)據(jù)能充分利用的話,其實(shí)可以用相對(duì)簡(jiǎn)單的算法就能達(dá)到很好的效果。”他說道。值得一提的是,馬云也多次在公開場(chǎng)合表達(dá)過“數(shù)據(jù)比算法重要”的類似觀點(diǎn),聶博士在得知自己對(duì)這一問題的看法和馬云演講中所講的觀點(diǎn)高度一致后,感到非常開心。思維理念與阿里又一次接軌,使得聶博士對(duì)未來的研究也充滿了信心與期待。

除此之外,聶再清博士還對(duì)于筆者提出的關(guān)于目前知識(shí)圖譜建立的難點(diǎn),以及自然語言理解面臨的挑戰(zhàn)等問題給出了詳細(xì)的解答。以下是雷鋒網(wǎng)的專訪內(nèi)容。

一、過去的十三年里,您為什么一直堅(jiān)持在微軟做研究?

聶再清:微軟就像一個(gè)大家庭一樣,我學(xué)習(xí)了很多,成長(zhǎng)了很多。包括在離職的最后一刻都很難過,覺得很不舍。

在微軟做研究確實(shí)是一個(gè)很好的地方,但我有一點(diǎn)是想把一件事情從研究階段一直推到產(chǎn)品,想把它的影響力做出來。我在微軟主要做了這幾件事情,學(xué)術(shù)搜索,人立方,包括在微軟時(shí)做的最后一個(gè)產(chǎn)品 (LUIS) 這些項(xiàng)目我覺得在研究這一層已經(jīng)很好了,很多人都知道,也有很多人在用,但是還沒有變成特別有影響力的(路人皆知的)產(chǎn)品。

我到阿里來,是覺得現(xiàn)在人工智能實(shí)驗(yàn)室有這么一個(gè)機(jī)會(huì),有可能把一件事情從一個(gè)研究做成一個(gè)真正影響到千家萬戶的實(shí)用的產(chǎn)品。我認(rèn)為做研究在微軟研究院還是很好的,但每個(gè)人的追求不同,其實(shí)我在研究院也不是最典型的發(fā)論文的研究員,我一直是以把一件事情做出來這樣的方式來做研究。我更多是希望做一個(gè)創(chuàng)新產(chǎn)品時(shí),在做的過程中能及時(shí)拿到別人的反饋,再形成新的解決方案,形成新的創(chuàng)新,按照這個(gè)思路把這樣的創(chuàng)新一步一步去迭代。我在微軟亞洲研究院也都是這樣一個(gè)思路做研究。在我們以前沈向洋當(dāng)院長(zhǎng)時(shí),把這個(gè)叫做(deployment-driven research)拿到用戶的反饋去做研究。

二、為什么選擇在這個(gè)時(shí)機(jī)加入阿里,和阿里達(dá)摩院成立有關(guān)系嗎?

聶再清:阿里改變了很多人的生活方式,是一個(gè)很落地的公司。我很崇拜馬老師(馬云),他在做有用又很有趣的事兒。另外我和阿里人工智能實(shí)驗(yàn)室的淺雪(花名)談的很默契,我覺得在這里可以把我的一些想法做成真正影響很多人生活的一個(gè)東西。達(dá)摩院是我決定來阿里之后成立的,達(dá)摩院做研究的方式,我是很認(rèn)同的。

三、基于興趣做研究和基于產(chǎn)品需求做研究,您認(rèn)為哪一個(gè)好?

聶再清:我覺得兩者不違背。首先,我不會(huì)去做一個(gè)我不感興趣的研究,我在微軟所做的事情和在這里做的是相關(guān)聯(lián)的,并不是毫無關(guān)系的。我原來的興趣愛好或原來的想法,在這里能夠擴(kuò)大,能更快速的實(shí)現(xiàn)。如果站在公司的角度,如果公司讓我做一個(gè)我不太感興趣的事兒,對(duì)公司也不是最大的利益訴求。我覺得這兩點(diǎn)可以搭配的很好。

四、阿里AI Labs,總體可分為終端實(shí)驗(yàn)室和算法實(shí)驗(yàn)室,您主要負(fù)責(zé)哪一塊兒?能具體談?wù)剢幔?/span>

聶再清:我所帶領(lǐng)的團(tuán)隊(duì)是偏算法研究。主要負(fù)責(zé)兩個(gè),知識(shí)圖譜和自然語言理解。這跟我以前在微軟所做的事情一直都是分不開的,包括我在博士期間,都是可以連起來的。我在博士期間做了一個(gè)學(xué)術(shù)搜索,當(dāng)時(shí)并沒有把所有數(shù)據(jù)都集成起來,建成由實(shí)體關(guān)系連接的知識(shí)圖譜形式,這個(gè)形式是在微軟以后,我才慢慢提出來的。我來微軟的第一個(gè)項(xiàng)目就是微軟的學(xué)術(shù)搜索,這個(gè)在05年就發(fā)布了,我一直在微軟做的事兒還是知識(shí)圖譜的建立,包括后來的人立方;LUIS,基于知識(shí)圖譜怎樣去做語言理解,把自然語言中的一句話對(duì)應(yīng)到知識(shí)圖譜上的一個(gè)實(shí)體ID(唯一標(biāo)識(shí)號(hào))上,比如說,一個(gè)用戶說“播放馬云的歌”,自然語言理解的一個(gè)很重要的工作就是把用戶提到的字符串“馬云”對(duì)應(yīng)到知識(shí)圖譜上的一個(gè)具體的人物ID上去 。我在做的一直是建立知識(shí)圖譜,然后把自然語言映射(map)到知識(shí)圖譜中,因?yàn)榫唧w到了知識(shí)圖譜中的ID了,才能做一個(gè)聊天機(jī)器人,才能去執(zhí)行,否則只是字符串,字符串是無法執(zhí)行的。我到阿里人工智能實(shí)驗(yàn)室,還是建立知識(shí)圖譜,還是做自然語言理解,還是把自然語言理解放到知識(shí)圖譜中的ID上。要和用戶自然交互,一定要理解用戶這句話什么意思,這句話中有什么意圖,意圖中有哪些實(shí)體,比如“杭州明天天氣怎么樣?”,意圖就是天氣預(yù)報(bào),杭州和明天都必須對(duì)應(yīng)到可唯一識(shí)別的實(shí)體ID上去。

我做的知識(shí)圖譜和自然語言理解是連在一起的。

五、目前自然語言理解有哪些比較難的問題嗎?

聶再清:最難的問題是自然語言的多樣性和它的歧義性。比如問天氣怎么樣,有太多種問法了。比如,明天會(huì)下雨嗎?明天能出去玩嗎?明天天氣怎么樣?明天天晴嗎?有太多這種多樣性。歧義性也是,比如說一個(gè)地名,有的時(shí)候一個(gè)詞代表不同的意思,你怎么把它變成一個(gè)意圖,一個(gè)ID。我感覺自然語言理解是人工智能最難的一環(huán),是真正觸碰到智能了。我希望和廣大開發(fā)者們一起建立一個(gè)很好的生態(tài)系統(tǒng),把一個(gè)個(gè)技能都建立的很好,一起建立一個(gè)很好的自然語言交互開發(fā)者平臺(tái)和一個(gè)智能的語音交互入口。

六、自然語言理解還有一個(gè)難點(diǎn)是多輪對(duì)話。您怎么看待這個(gè)?

聶再清:對(duì)的,比如你根據(jù)用戶說出的一個(gè)東西,基于我們的意圖識(shí)別和實(shí)體抽?。╯lot filling)結(jié)果,確定機(jī)器現(xiàn)在的狀態(tài)和要做的下一個(gè)動(dòng)作(或給用戶的一個(gè)回復(fù)):可能下一步是要去查某網(wǎng)站(或一個(gè)第三方提供的API接口),然后再把網(wǎng)站的結(jié)果返回給用戶,讓用戶再確認(rèn)。這個(gè)在學(xué)術(shù)圈里叫對(duì)話管理(dialog manager)確實(shí)很有挑戰(zhàn)性,我們正在嘗試深度強(qiáng)化學(xué)習(xí)的方法,怎么能夠讓機(jī)器跟這個(gè)環(huán)境去交互,怎么通過自己去學(xué)習(xí)。

七、您所帶領(lǐng)的團(tuán)隊(duì)都為阿里人工智能實(shí)驗(yàn)室提供哪些技術(shù)支撐?

聶再清:有很多:比如意圖的理解,實(shí)體的抽取,也包括對(duì)話管理,還有知識(shí)圖譜這一塊兒。技術(shù)團(tuán)隊(duì)會(huì)支撐產(chǎn)品中很多具體的、需要實(shí)現(xiàn)的東西。我很喜歡反饋,從產(chǎn)品經(jīng)理那里得到的反饋會(huì)給我很好的指導(dǎo)。終端團(tuán)隊(duì),技術(shù)團(tuán)隊(duì)以及其他各個(gè)人工智能實(shí)驗(yàn)室之間聯(lián)系也都很緊密。

八、剛您談到了自然語言處理的難點(diǎn),可否給我們談?wù)勚R(shí)圖譜面臨哪些技術(shù)挑戰(zhàn)?

聶再清:知識(shí)圖譜所面臨的挑戰(zhàn)主要來自于知識(shí)圖譜的構(gòu)建與學(xué)習(xí)以及知識(shí)的表示與推理這兩個(gè)方面。其中知識(shí)圖譜的構(gòu)建與學(xué)習(xí)中的最主要的難點(diǎn)是,判斷兩個(gè)不同語境或不同圖譜中提到的實(shí)體是不是同一個(gè)實(shí)體。中國(guó)有幾十萬個(gè)張磊,同名,重名的問題,這兩個(gè)人是不是同一個(gè),該不該融合在一起,怎么能把每個(gè)張磊的信息都正確地匹配到知識(shí)圖譜中的對(duì)應(yīng)實(shí)體中去呢。如果是產(chǎn)品的話,很多不同的東西,到底是不是同一個(gè)實(shí)體,比如iPhone 6、 iPhone plus、iPhone 6 金色等等。關(guān)于實(shí)體之間的關(guān)系圖,我其實(shí)不喜歡別人說我這個(gè)知識(shí)圖譜有多少條知識(shí)。其實(shí)知識(shí)圖譜里面關(guān)鍵在于有多少高精度的知識(shí)。

把一些非結(jié)構(gòu)數(shù)據(jù),多結(jié)構(gòu)數(shù)據(jù),或者結(jié)構(gòu)化數(shù)據(jù),糅合成一個(gè),變成一張大圖。如果是從非結(jié)構(gòu)數(shù)據(jù)變成結(jié)構(gòu)化數(shù)據(jù),然后把它融進(jìn)來,這是個(gè)抽取的過程,也是個(gè)理解的過程,比如,通過讀紅樓夢(mèng),把里面的人物建立一個(gè)關(guān)系圖,其實(shí)就是理解自然語言,好處在于這個(gè)人物關(guān)系圖可能在某個(gè)數(shù)據(jù)庫已經(jīng)有了,難點(diǎn)是怎樣把新抽取出來的實(shí)體信息和他們的關(guān)系正確地加到已有知識(shí)圖譜中去。

知識(shí)圖譜的構(gòu)建與學(xué)習(xí)中遇到的難點(diǎn)本質(zhì)上是由自然語言中的多樣性和歧義性帶來的。知識(shí)的表示和推理方面也有很多挑戰(zhàn),由于時(shí)間關(guān)系今天就不多講了。

九、高精度知識(shí),需要做大數(shù)據(jù)挖掘,您認(rèn)為算法重要還是數(shù)據(jù)重要?

聶再清:我個(gè)人覺得,數(shù)據(jù)重要。如果數(shù)據(jù)能充分利用的話,我可以用相對(duì)簡(jiǎn)單的算法就能達(dá)到很好的效果。不是說不要算法,但不是單靠算法的突破,就可以把一個(gè)難題解決。我原來在微軟研究院的時(shí)候,創(chuàng)建了大數(shù)據(jù)挖掘組,我一直認(rèn)為數(shù)據(jù)是很重要的。

十、加入阿里后,有什么新的體驗(yàn)?

聶再清:加入剛一個(gè)多月的時(shí)間,感覺各部門之間的聯(lián)系都很緊密,工作節(jié)奏比較快,大家都很接地氣(對(duì)用戶反饋都非常重視)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

專訪阿里聶再清:微軟十三年老兵,為何選擇加盟了阿里?

分享:
相關(guān)文章

編輯&記者

AI科技評(píng)論員,微信:yeohandwin
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說