0
本文作者: 叢末 | 2019-01-18 16:26 |
雷鋒網 AI 科技評論按: 2018 年開始,NeuroAscent 聯(lián)合創(chuàng)始人、數據科學家 Sanyam Bhutani 相繼對 AI 領域一些優(yōu)秀的從業(yè)者、研究者以及 kagglers 進行了采訪,并在其博客中推出了系列文章,大家可前往以下地址查看 Sanyam Bhutani 的采訪系列文:
https://hackernoon.com/interviews-with-machine-learning-heroes-504762ba5dd6
近日,Sanyam Bhutani 采訪到了 Salesforce 的首席科學家 Richard Socher 教授。在采訪中,Richard 根據自己當年的機器學習經歷分享了自己的學習經驗,并針對機器學習的研究成果、行業(yè)現狀、面臨的問題以及未來的發(fā)展表達了自己的見解。雷鋒網 AI 科技評論編譯如下。
今天,我很榮幸能采訪到 Richard Socher 教授。Richard 是 Salesforce 的首席科學家,于斯坦福大學博士畢業(yè),師從吳恩達和 Chris Channing 學習機器學習和 NLP。他曾是斯坦福大學深度學習與自然語言處理課程的講師,現在則擔任 NLP 標準公開課 CS224N 的慕課講師。
以下為采訪實錄:
Sanyam Bhutani:Richard 您好,很感謝您能接受我的采訪。
Dr. Richard Socher:我也要謝謝您選擇采訪我。
Sanyam Bhutani:現在,您在 Salesforce 擔任首席科學家一職。您也曾是 NLP 領域最好、最有名的課程之一——斯坦福大學深度學習與自然語言處理課程的講師,并擁有機器學習方向的博士學位。您能跟讀者分享一下您是怎樣開始學習機器學習的嗎?是什么讓您對深度學習產生了興趣呢?
Dr. Richard Socher:從小到大我都對數學非常感興趣,同時我也熱愛語言,并堅信它們是人類智慧最有趣的產物以及將我們人類從本質上與動物區(qū)別開來。AI 能夠讓我將這些熱愛都結合起來,并創(chuàng)造一些能改變這個世界的東西。我在德國開啟我的求學生涯,之后來到美國攻讀博士學位。
Sanyam Bhutani:剛剛博士畢業(yè),您就選擇了創(chuàng)立 MetaMind,而不是加入「科技巨頭」,當時您是出于怎樣的考量選擇這條道路,為什么您認為這一選擇是必然的?
Dr. Richard Socher:當我從斯坦福大學博士畢業(yè)時,我希望能夠創(chuàng)造些什么,能夠將深度學習所有的潛能都通通利用起來,而不僅僅是通過某個特定的應用來利用它很小的一部分。我在 2014 年創(chuàng)立 MetaMind,將它定義為對圖像和文本數據進行分析、標注和預測的 AI 平臺,來幫助企業(yè)做出更明智、更快速和更準確的決策。在 2016 年,MetaMind 被 Salesforce 收購,不過 Salesforce 允許我們這個小團隊繼續(xù)作為「愛因斯坦」項目的一部分,將 AI 能力賦予數百萬位用戶。
Sanyam Bhutani:到現在,您已經在最前沿的研究領域工作了十年左右,這些年工業(yè)界和學界的哪些發(fā)展成果是您最喜歡的?
Dr. Richard Socher:對于我團隊在自然語言十項全能(Natural Language Decathlon,簡稱 decaNLP)上取得的最新成果,我感到無比興奮和自豪。decaNLP 是一個學習可同時執(zhí)行十項復雜的自然語言任務的通用 NLP 模型的新基準。工業(yè)界在 AI 模擬人類語言的能力上取得巨大進展的同時,decaNLP 將重新定義語言理解成功與否的基準,并為 AI 模型所能回答的問題類型開拓了新的可能性。在零樣本學習技術的幫助下,decaNLP 擁有了一項人類獨有的能力:模型對于從未見過的輸入也可以進行推理
Sanyam Bhutani:可以說,自然語言處理的發(fā)展要落后于計算機視覺。您對于當前這種情況有什么看法?現在是開始成為一位 NLP 從業(yè)者的好時期嗎?
Dr. Richard Socher:計算機視覺和語言理解面臨著非常不同的挑戰(zhàn)。在計算機視覺領域,我們憑借廣泛到足以囊括大量圖像類目的 ImageNet,取得了很多成果。結合了神經網絡的 ImageNet,是能很好地處理許多不同視覺問題的默認模型。不過,NLP 與計算機視覺所面臨的問題各不相同。語言理解要微妙得多,并且單個 NLP 任務或數據集無法應對語言理解整體的復雜性。
從很多方面來說,decaNLP 對于 NLP 的作用就相當于 ImageNet 對于計算機視覺的作用。由于問答太過廣泛,并且你可以詢問任意問題,因而我們可以將任意一個 NLP 問題視作一個問題——有什么看法?這句話翻譯過來是什么?等等,——同時訓練一個模型去同時執(zhí)行幾項任務。
Sanyam Bhutani:對于有志于從事自然語言處理工作的讀者以及初學者,您最想給他們提出的建議是什么?
Dr. Richard Socher:對于初步接觸到這一領域的學子,我推薦他們利用好網上的資源。例如我之前的斯坦福課程(cs224n.stanford.edu)就在網上對外開放了,并且 Salesforce 最近也在 Trailhead(Salesforce 的免費線上學習平臺)上發(fā)布了一些 NLP 深度學習相關的不錯的內容(內容查看地址:https://trailhead.salesforce.com/content/learn/trails/explore-deep-learning-for-nlp)。
Sanyam Bhutani:目前這一領域的研究呈現爆發(fā)式的增長,您是怎樣跟上最前沿的發(fā)展步伐的?
Dr. Richard Socher:我通常使用 Twitter 了解研究的最新動態(tài),同時與該領域的其他人保持聯(lián)系。
Sanyam Bhutani:得益于互聯(lián)網,我能夠有機會收聽您精彩的主旨演講以及講座(我是您的粉絲)。
針對怎樣有效地表達科技觀點,您能分享一些技巧嗎?
Dr. Richard Socher:我認為最好是簡單地表達觀點,并嘗試去探討 AI 在與人類相關的方面對他們所帶來的影響。
Sanyam Bhutani:您是 AI 倫理的支持者,您能指出某些領域是我們即便在 AI 早期階段也必須加以關注的嗎?
Dr. Richard Socher:沒有事實依據的擔憂和實際發(fā)生的威脅之間是有區(qū)別的,AI 偏見是我們需要應對的即將到來的擔憂,然而「世界末日論」則是一種危險的干擾。人們需要開始密切注意確保 AI 訓練數據集的多樣性和無偏見性以及團隊要從多樣的視角來創(chuàng)建這些 AI 系統(tǒng)。
Sanyam Bhutani:decaNLP 帶來了一些非常有趣的成果。您怎樣看待多任務學習?那么 NLP 以外的多任務學習呢?
Dr. Richard Socher:多任務學習對于讓 AI 擁有更好的語境理解能力和直覺力至關重要。多任務學習能夠讓我們從相關的任務中收益,并最終獲得更好的性能,而不會僅僅是專注于單任務的性能,從而可能導致丟失能夠提升我們所關注的度量標準的重要信息。
Sanyam Bhutani:對于 AI 未來的發(fā)展,最讓您激動的是什么?
您認為 Siri 有朝一日能幫我完成 CS224n 課程的作業(yè)嗎?
Dr. Richard Socher:AI 在醫(yī)療領域具備一些潛力——可以讓放射學和病理學更高效,同時可以幫助醫(yī)生診斷人類肉眼可能發(fā)現不了的疾病。作為一位研究者,我很高興看到 NLP 的突破性成果走出了實驗室,并實現了產品化。在不久的將來,我認為將會有更自然和更具有直覺力的聊天機器人出現,它們能夠對客戶的服務電話進行恰當的回復,完成各類任務甚至向人類表達同情心。
Sanyam Bhutani:您是否有「機器學習被過度炒作」的感受?
Dr. Richard Socher:從人工智能出現開始,圍繞 AI 的炒作就不斷。從上世紀 50 年代開始,人們就一直在談論像人類一樣說話、走路和運動的 AI,但是現在我們也還是只能說——那是在接下來的幾年時間里可以實現的未來。
AI 周圍充斥著興奮感是好的,并且作為一位研究者,我當然也很興奮,但我們需要注意的是,不要在它們的實際能力以外去推算這一領域的突破,否則就會給人類帶來困惑和誤解。
Sanyam Bhutani:再次感謝您接受本次采訪。
關于我的采訪系列文:
最近,我開始推進我的機器學習自學之旅。但是說實話,如果沒有這些出色的線上社區(qū)以及那些幫助過我的優(yōu)秀的人,我無法取得這些進步。
在這個博客系列文中,我與那些真正對我起到了激勵作用并被我當做人生導師的人進行了對話。
而我做這件事情背后的動力,你或許可以從這些我有機會學習的優(yōu)秀的人身上找到答案,也希望你能從他們身上學到點什么。
大家如果對機器學習感興趣,可以加入我一起自學機器學習(https://hackernoon.com/launching-my-company-a-scholarship-and-a-webinar-277e3b66e351)。我的 Twitter 地址是 http://twitter.com/bhutanisanyam1。
via:https://hackernoon.com/interview-with-chief-scientist-at-salesforce-dr-richard-socher-c982b9edcd12 雷鋒網雷鋒網
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。