0
本文作者: 叢末 | 2019-01-18 16:26 |
雷鋒網(wǎng) AI 科技評論按: 2018 年開始,NeuroAscent 聯(lián)合創(chuàng)始人、數(shù)據(jù)科學(xué)家 Sanyam Bhutani 相繼對 AI 領(lǐng)域一些優(yōu)秀的從業(yè)者、研究者以及 kagglers 進行了采訪,并在其博客中推出了系列文章,大家可前往以下地址查看 Sanyam Bhutani 的采訪系列文:
https://hackernoon.com/interviews-with-machine-learning-heroes-504762ba5dd6
近日,Sanyam Bhutani 采訪到了 Salesforce 的首席科學(xué)家 Richard Socher 教授。在采訪中,Richard 根據(jù)自己當(dāng)年的機器學(xué)習(xí)經(jīng)歷分享了自己的學(xué)習(xí)經(jīng)驗,并針對機器學(xué)習(xí)的研究成果、行業(yè)現(xiàn)狀、面臨的問題以及未來的發(fā)展表達了自己的見解。雷鋒網(wǎng) AI 科技評論編譯如下。
今天,我很榮幸能采訪到 Richard Socher 教授。Richard 是 Salesforce 的首席科學(xué)家,于斯坦福大學(xué)博士畢業(yè),師從吳恩達和 Chris Channing 學(xué)習(xí)機器學(xué)習(xí)和 NLP。他曾是斯坦福大學(xué)深度學(xué)習(xí)與自然語言處理課程的講師,現(xiàn)在則擔(dān)任 NLP 標準公開課 CS224N 的慕課講師。
以下為采訪實錄:
Sanyam Bhutani:Richard 您好,很感謝您能接受我的采訪。
Dr. Richard Socher:我也要謝謝您選擇采訪我。
Sanyam Bhutani:現(xiàn)在,您在 Salesforce 擔(dān)任首席科學(xué)家一職。您也曾是 NLP 領(lǐng)域最好、最有名的課程之一——斯坦福大學(xué)深度學(xué)習(xí)與自然語言處理課程的講師,并擁有機器學(xué)習(xí)方向的博士學(xué)位。您能跟讀者分享一下您是怎樣開始學(xué)習(xí)機器學(xué)習(xí)的嗎?是什么讓您對深度學(xué)習(xí)產(chǎn)生了興趣呢?
Dr. Richard Socher:從小到大我都對數(shù)學(xué)非常感興趣,同時我也熱愛語言,并堅信它們是人類智慧最有趣的產(chǎn)物以及將我們?nèi)祟悘谋举|(zhì)上與動物區(qū)別開來。AI 能夠讓我將這些熱愛都結(jié)合起來,并創(chuàng)造一些能改變這個世界的東西。我在德國開啟我的求學(xué)生涯,之后來到美國攻讀博士學(xué)位。
Sanyam Bhutani:剛剛博士畢業(yè),您就選擇了創(chuàng)立 MetaMind,而不是加入「科技巨頭」,當(dāng)時您是出于怎樣的考量選擇這條道路,為什么您認為這一選擇是必然的?
Dr. Richard Socher:當(dāng)我從斯坦福大學(xué)博士畢業(yè)時,我希望能夠創(chuàng)造些什么,能夠?qū)⑸疃葘W(xué)習(xí)所有的潛能都通通利用起來,而不僅僅是通過某個特定的應(yīng)用來利用它很小的一部分。我在 2014 年創(chuàng)立 MetaMind,將它定義為對圖像和文本數(shù)據(jù)進行分析、標注和預(yù)測的 AI 平臺,來幫助企業(yè)做出更明智、更快速和更準確的決策。在 2016 年,MetaMind 被 Salesforce 收購,不過 Salesforce 允許我們這個小團隊繼續(xù)作為「愛因斯坦」項目的一部分,將 AI 能力賦予數(shù)百萬位用戶。
Sanyam Bhutani:到現(xiàn)在,您已經(jīng)在最前沿的研究領(lǐng)域工作了十年左右,這些年工業(yè)界和學(xué)界的哪些發(fā)展成果是您最喜歡的?
Dr. Richard Socher:對于我團隊在自然語言十項全能(Natural Language Decathlon,簡稱 decaNLP)上取得的最新成果,我感到無比興奮和自豪。decaNLP 是一個學(xué)習(xí)可同時執(zhí)行十項復(fù)雜的自然語言任務(wù)的通用 NLP 模型的新基準。工業(yè)界在 AI 模擬人類語言的能力上取得巨大進展的同時,decaNLP 將重新定義語言理解成功與否的基準,并為 AI 模型所能回答的問題類型開拓了新的可能性。在零樣本學(xué)習(xí)技術(shù)的幫助下,decaNLP 擁有了一項人類獨有的能力:模型對于從未見過的輸入也可以進行推理
Sanyam Bhutani:可以說,自然語言處理的發(fā)展要落后于計算機視覺。您對于當(dāng)前這種情況有什么看法?現(xiàn)在是開始成為一位 NLP 從業(yè)者的好時期嗎?
Dr. Richard Socher:計算機視覺和語言理解面臨著非常不同的挑戰(zhàn)。在計算機視覺領(lǐng)域,我們憑借廣泛到足以囊括大量圖像類目的 ImageNet,取得了很多成果。結(jié)合了神經(jīng)網(wǎng)絡(luò)的 ImageNet,是能很好地處理許多不同視覺問題的默認模型。不過,NLP 與計算機視覺所面臨的問題各不相同。語言理解要微妙得多,并且單個 NLP 任務(wù)或數(shù)據(jù)集無法應(yīng)對語言理解整體的復(fù)雜性。
從很多方面來說,decaNLP 對于 NLP 的作用就相當(dāng)于 ImageNet 對于計算機視覺的作用。由于問答太過廣泛,并且你可以詢問任意問題,因而我們可以將任意一個 NLP 問題視作一個問題——有什么看法?這句話翻譯過來是什么?等等,——同時訓(xùn)練一個模型去同時執(zhí)行幾項任務(wù)。
Sanyam Bhutani:對于有志于從事自然語言處理工作的讀者以及初學(xué)者,您最想給他們提出的建議是什么?
Dr. Richard Socher:對于初步接觸到這一領(lǐng)域的學(xué)子,我推薦他們利用好網(wǎng)上的資源。例如我之前的斯坦福課程(cs224n.stanford.edu)就在網(wǎng)上對外開放了,并且 Salesforce 最近也在 Trailhead(Salesforce 的免費線上學(xué)習(xí)平臺)上發(fā)布了一些 NLP 深度學(xué)習(xí)相關(guān)的不錯的內(nèi)容(內(nèi)容查看地址:https://trailhead.salesforce.com/content/learn/trails/explore-deep-learning-for-nlp)。
Sanyam Bhutani:目前這一領(lǐng)域的研究呈現(xiàn)爆發(fā)式的增長,您是怎樣跟上最前沿的發(fā)展步伐的?
Dr. Richard Socher:我通常使用 Twitter 了解研究的最新動態(tài),同時與該領(lǐng)域的其他人保持聯(lián)系。
Sanyam Bhutani:得益于互聯(lián)網(wǎng),我能夠有機會收聽您精彩的主旨演講以及講座(我是您的粉絲)。
針對怎樣有效地表達科技觀點,您能分享一些技巧嗎?
Dr. Richard Socher:我認為最好是簡單地表達觀點,并嘗試去探討 AI 在與人類相關(guān)的方面對他們所帶來的影響。
Sanyam Bhutani:您是 AI 倫理的支持者,您能指出某些領(lǐng)域是我們即便在 AI 早期階段也必須加以關(guān)注的嗎?
Dr. Richard Socher:沒有事實依據(jù)的擔(dān)憂和實際發(fā)生的威脅之間是有區(qū)別的,AI 偏見是我們需要應(yīng)對的即將到來的擔(dān)憂,然而「世界末日論」則是一種危險的干擾。人們需要開始密切注意確保 AI 訓(xùn)練數(shù)據(jù)集的多樣性和無偏見性以及團隊要從多樣的視角來創(chuàng)建這些 AI 系統(tǒng)。
Sanyam Bhutani:decaNLP 帶來了一些非常有趣的成果。您怎樣看待多任務(wù)學(xué)習(xí)?那么 NLP 以外的多任務(wù)學(xué)習(xí)呢?
Dr. Richard Socher:多任務(wù)學(xué)習(xí)對于讓 AI 擁有更好的語境理解能力和直覺力至關(guān)重要。多任務(wù)學(xué)習(xí)能夠讓我們從相關(guān)的任務(wù)中收益,并最終獲得更好的性能,而不會僅僅是專注于單任務(wù)的性能,從而可能導(dǎo)致丟失能夠提升我們所關(guān)注的度量標準的重要信息。
Sanyam Bhutani:對于 AI 未來的發(fā)展,最讓您激動的是什么?
您認為 Siri 有朝一日能幫我完成 CS224n 課程的作業(yè)嗎?
Dr. Richard Socher:AI 在醫(yī)療領(lǐng)域具備一些潛力——可以讓放射學(xué)和病理學(xué)更高效,同時可以幫助醫(yī)生診斷人類肉眼可能發(fā)現(xiàn)不了的疾病。作為一位研究者,我很高興看到 NLP 的突破性成果走出了實驗室,并實現(xiàn)了產(chǎn)品化。在不久的將來,我認為將會有更自然和更具有直覺力的聊天機器人出現(xiàn),它們能夠?qū)蛻舻姆?wù)電話進行恰當(dāng)?shù)幕貜?fù),完成各類任務(wù)甚至向人類表達同情心。
Sanyam Bhutani:您是否有「機器學(xué)習(xí)被過度炒作」的感受?
Dr. Richard Socher:從人工智能出現(xiàn)開始,圍繞 AI 的炒作就不斷。從上世紀 50 年代開始,人們就一直在談?wù)撓袢祟愐粯诱f話、走路和運動的 AI,但是現(xiàn)在我們也還是只能說——那是在接下來的幾年時間里可以實現(xiàn)的未來。
AI 周圍充斥著興奮感是好的,并且作為一位研究者,我當(dāng)然也很興奮,但我們需要注意的是,不要在它們的實際能力以外去推算這一領(lǐng)域的突破,否則就會給人類帶來困惑和誤解。
Sanyam Bhutani:再次感謝您接受本次采訪。
關(guān)于我的采訪系列文:
最近,我開始推進我的機器學(xué)習(xí)自學(xué)之旅。但是說實話,如果沒有這些出色的線上社區(qū)以及那些幫助過我的優(yōu)秀的人,我無法取得這些進步。
在這個博客系列文中,我與那些真正對我起到了激勵作用并被我當(dāng)做人生導(dǎo)師的人進行了對話。
而我做這件事情背后的動力,你或許可以從這些我有機會學(xué)習(xí)的優(yōu)秀的人身上找到答案,也希望你能從他們身上學(xué)到點什么。
大家如果對機器學(xué)習(xí)感興趣,可以加入我一起自學(xué)機器學(xué)習(xí)(https://hackernoon.com/launching-my-company-a-scholarship-and-a-webinar-277e3b66e351)。我的 Twitter 地址是 http://twitter.com/bhutanisanyam1。
via:https://hackernoon.com/interview-with-chief-scientist-at-salesforce-dr-richard-socher-c982b9edcd12 雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。