0
本文作者: 楊曉凡 | 2018-07-20 09:41 |
雷鋒網(wǎng) AI 科技評(píng)論按:機(jī)器學(xué)習(xí)圈子這幾天發(fā)生了一件有趣的事,一群知名學(xué)者在 ICML 2018 上抱著吵架(辯論)的心思坐到一起,結(jié)果卻沒(méi)吵起來(lái)。
在 ICML 2018 開(kāi)幕之前,卡耐基梅隆大學(xué)的助理教授 Zachary C. Lipton 與斯坦福大學(xué)博士 Jacob Steinhardt 共同發(fā)表了一篇名為《Troubling Trends in Machine Learning Scholarship》(機(jī)器學(xué)習(xí)學(xué)術(shù)研究中的奇怪趨勢(shì))的文章,敘述了他們?cè)诮鼛啄甑臋C(jī)器學(xué)習(xí)學(xué)術(shù)研究中看到的四項(xiàng)奇怪的趨勢(shì):
無(wú)法在解釋和猜測(cè)之間做出明確的區(qū)分;
當(dāng)實(shí)證實(shí)驗(yàn)中得到了改進(jìn)時(shí),無(wú)法確認(rèn)改進(jìn)的真正來(lái)源,比如過(guò)于強(qiáng)調(diào)性能提升來(lái)源于神經(jīng)網(wǎng)絡(luò)架構(gòu)的非必須的改動(dòng),而實(shí)際上性能提升是來(lái)源于充分的超參數(shù)調(diào)試;
數(shù)學(xué)性:使用了很多數(shù)學(xué)概念和公式只為了混淆概念或者看起來(lái)高大上,而不是真的為了做出明確的表達(dá),比如會(huì)混淆技術(shù)性和非技術(shù)性的概念;
語(yǔ)言詞匯的濫用,比如用一些時(shí)髦的、內(nèi)涵口語(yǔ)化的詞匯,或者給已有的技術(shù)詞匯增加額外的含義。
除了對(duì)這些趨勢(shì)的解析和批評(píng)之外,兩位作者也對(duì)正確的論文寫(xiě)作風(fēng)格、如何正確地評(píng)審及發(fā)表論文給出了自己的建議。
除了這篇文章在推特被廣為轉(zhuǎn)發(fā)和討論,實(shí)際上 ICML 2018 也以這篇文章為引子,在最后一天的 workshop 中設(shè)置了一場(chǎng)辯論(Machine Learning: The Great Debates),邀請(qǐng)了許多知名機(jī)器領(lǐng)域的學(xué)者參與辯論。
整場(chǎng)辯論共分為四個(gè)話題:機(jī)器學(xué)習(xí)科研的嚴(yán)謹(jǐn)性、機(jī)器學(xué)習(xí)的公平性、機(jī)器學(xué)習(xí)的安全性以及深度學(xué)習(xí)方法的可能性與限制。16 位學(xué)者分為四組,每組針對(duì)一個(gè)話題進(jìn)行辯論。辯論中也穿插了小演講,Zachary Lipton 講解了一些文章中的重要觀點(diǎn),提醒各位學(xué)者對(duì)有害的做法保持警惕。
整場(chǎng)辯論內(nèi)容非常豐富,而且觀點(diǎn)的當(dāng)面溝通也擦出了許多火花,在場(chǎng)聽(tīng)眾都表示有耳目一新的感覺(jué)。雖然由于條件限制無(wú)法全文重現(xiàn)給大家,但雷鋒網(wǎng) AI 科技評(píng)論摘錄了一些討論中出現(xiàn)的非常經(jīng)典、令人深思的句子。
「深度學(xué)習(xí)」話題 —— 當(dāng)前以及可預(yù)見(jiàn)的深度學(xué)習(xí)方法有著固有的限制,這也限制了用深度學(xué)習(xí)方法做出高級(jí)機(jī)器智能的能力,除非我們有其它的方法作為補(bǔ)充
Gary Marcus,紐約大學(xué)心理學(xué)教授、曾任 Uber 人工智能實(shí)驗(yàn)室的負(fù)責(zé)人
如果你把輸入數(shù)據(jù)稍微改動(dòng)了一點(diǎn)點(diǎn),系統(tǒng)就不能好好工作了,那它是不是真的「學(xué)到了」任何東西呢?
如果我們把生物演化也算作學(xué)習(xí)的話,那任何適應(yīng)性過(guò)程都可以算作是「學(xué)習(xí)」,然后「學(xué)習(xí)」這個(gè)詞的所指就會(huì)變得非常寬泛,我們現(xiàn)在的辯論也就沒(méi)有任何意義了。
如果沒(méi)有任何概念模型,只是做黑箱優(yōu)化是不行的。
Thomas G.Dietterich,俄勒岡州立大學(xué)退休教授、AAAI 前主席
Gary Marcus 家的女兒大腦里通過(guò)演化的方式編碼了 200 萬(wàn)年的數(shù)據(jù),所以她才能弄清楚椅子是怎么回事。
我們不要再把算法擬人化了。算法的名字應(yīng)當(dāng)體現(xiàn)出它們是做什么的、如何做的,而不是對(duì)智慧、好奇心、夢(mèng)境之類的人類概念的模糊的比擬。
所以為什么貓有四條腿?(Gary Marcus 接著說(shuō):而且四條腿去掉一條以后它還是能走路。)
對(duì)于因果關(guān)系,我覺(jué)得人們高估了因果關(guān)系的重要程度,而且人類自己處理因果關(guān)系的能力也不怎么樣。所以它才是一個(gè)有趣的研究課題。
80% 到 90% 的人類智慧可能都是和社交行為、和感情相關(guān)的,但這方面我們很難獲得數(shù)據(jù)。
我們這個(gè) ICMLDebates 要辯論的內(nèi)容,不應(yīng)該是討論如何重新定義我們正在討論的這些詞到底是什么意思。
「平等性」話題 —— 為了圍繞平等性問(wèn)題展開(kāi)有效的討論,機(jī)器學(xué)習(xí)社區(qū)不應(yīng)該把平等性簡(jiǎn)化為一個(gè)技術(shù)性問(wèn)題。相反地,這個(gè)問(wèn)題應(yīng)當(dāng)越來(lái)越多地、越來(lái)越明顯地引起大范圍的機(jī)構(gòu)的改變,也要表明政治因素對(duì)于技術(shù)本身影響的立場(chǎng)
Rodrigo Ochigame,MIT 博士生,MIT 多媒體實(shí)驗(yàn)室人工智能道德與管理小組
科技行業(yè)如今對(duì)平等性做的事情,就和 1980 年代保險(xiǎn)行業(yè)對(duì)保險(xiǎn)精算做的事情一樣,它成功地終結(jié)了這種社會(huì)運(yùn)動(dòng)。
平等的算法是不存在的。但平等的決定是存在的。聲稱要開(kāi)發(fā)平等的算法很簡(jiǎn)單,這也是企業(yè)們常用的政治策略;然后他們就得以回避算法平等性問(wèn)題帶來(lái)的深遠(yuǎn)的社會(huì)影響。
「嚴(yán)謹(jǐn)性」話題
Zachary Lipton,CMU 助理教授,《Troubling Trends in Machine Learning Scholarship》一作
科學(xué)研究的意義在于有價(jià)值的貢獻(xiàn),而不是掙大錢(qián)。
新手們可能不了解開(kāi)放性的問(wèn)題都有哪些,我們也不要給他們添亂。
我們應(yīng)當(dāng)優(yōu)先關(guān)注的是新發(fā)現(xiàn)的知識(shí),而不是新發(fā)現(xiàn)的網(wǎng)絡(luò)架構(gòu)。
我們要盡量避免用「平等性」、「可解釋性」這樣的「旅行箱」式的詞匯 —— 當(dāng)你打開(kāi)它去看它的時(shí)候,誰(shuí)知道會(huì)冒出來(lái)什么?;旧厦總€(gè)人都對(duì)這些詞有不同的理解,在理解它們之前先要做許許多多的解釋和定義。
James Bradbury
數(shù)學(xué)式的嚴(yán)謹(jǐn)性和口語(yǔ)化的可解釋性是這根坐標(biāo)的兩端,它們自己并不是問(wèn)題本身。
我們需要更多的調(diào)查和實(shí)驗(yàn)論文來(lái)驗(yàn)證我們過(guò)去做過(guò)的選擇是否正確。
口語(yǔ)化的人類概念(比如「好奇心」)對(duì)于真正的溝通來(lái)說(shuō)非常重要,因?yàn)樗鼈兛梢院透鼜V泛的社會(huì)概念以及人類直覺(jué)產(chǎn)生聯(lián)系。
「安全性」話題 —— 如今的機(jī)器學(xué)習(xí)系統(tǒng)如此脆弱,而這個(gè)問(wèn)題又如此關(guān)鍵,以至于我們不應(yīng)當(dāng)允許在真實(shí)世界場(chǎng)景中廣泛地運(yùn)用它們
Percy Liang,斯坦福大學(xué)助理教授,知名 NLP 領(lǐng)域?qū)W者
形式上正規(guī)的驗(yàn)證是沒(méi)有用的,但是嘗試做這件事是有用的。
攻擊的數(shù)學(xué)模型往往過(guò)于簡(jiǎn)單,無(wú)法代表真實(shí)世界可行的、有用的狀況。
從「AI in vitro」(試管階段的 AI)到「AI in vivo」(胚胎階段的 AI)是有切實(shí)的區(qū)別的。如果我們不嘗試部署 AI 系統(tǒng),我們也就無(wú)法學(xué)習(xí)。
Aleksander Madry,MIT 副教授, CSAIL 小組成員
(對(duì) Percy Liang 說(shuō))我喜歡你的觀點(diǎn),這些觀點(diǎn)非常有創(chuàng)造力。我完全不同意它們,但我喜歡它們。
可能我們需要提醒年輕的研究者們注意,論文中的內(nèi)容「不總是」正確的。
對(duì)于這場(chǎng)辯論,大家也許期待學(xué)者們自發(fā)地分成正反兩方,展開(kāi)激烈的唇槍舌劍。不過(guò)顯然參與辯論的各位學(xué)者都對(duì)領(lǐng)域內(nèi)現(xiàn)存的問(wèn)題有清醒的認(rèn)識(shí),以至于多數(shù)問(wèn)題上參與辯論的四個(gè)人都能很快達(dá)成一致。參與圍觀辯論的 AAAI 主席、亞利桑那州立大學(xué)教授 Subbarao Kambhampati 發(fā)推無(wú)不遺憾地表示:
目前為止,ICML Debates 似乎很好地支持了那個(gè)「舒服地坐在方桌子的同一面的人很難吵起來(lái)」的假說(shuō)
當(dāng)人們或多或多少彼此認(rèn)同的時(shí)候,確實(shí)很難展開(kāi)扣人心弦的辯論(也可能是他們都太溫和,不同意的時(shí)候也不會(huì)表現(xiàn)出來(lái))
圍觀了辯論的 Endgame 數(shù)據(jù)科學(xué)技術(shù)總監(jiān) Hyrum Anderson 也總結(jié)出了一件自己覺(jué)得值得深思的事情:攻擊者可以用意想不到的方法攻擊看起來(lái)根本不重要的系統(tǒng),最終造成巨大的后果,「我們當(dāng)時(shí)只不過(guò)是有一個(gè)廉價(jià)的推薦系統(tǒng)而已,現(xiàn)在 Trump 已經(jīng)當(dāng)上總統(tǒng)了」。
在論文中發(fā)表新的技術(shù)固然有意義,但圍繞新技術(shù)、新風(fēng)氣,還有太多的東西值得我們仔細(xì)思考。雷鋒網(wǎng) AI 科技評(píng)論報(bào)道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。