0
雷鋒網(wǎng) AI 科技評論按:今早,DeepMind 發(fā)出一篇年度總結(jié)文,盤點了 2017 年中自己在新的 AI 技術研發(fā)方面的研究成果,以及在 AI 技術的社會影響方面的所作所為。
可以說,AlphaGo 是大眾眼中的 DeepMind 的重頭戲,他們自撰的總結(jié)文也是以 AlphaGo 開頭、以 AlphaGo Zero 結(jié)尾。不過 DeepMind 的技術成果和在社會責任方面的努力真的有很多,關注我們的讀者在這一年中也看到了不少 DeepMind 的各方面研究成果,實驗室地點也擴張到了加拿大蒙特利爾和美國加利福尼亞。雷鋒網(wǎng) AI 科技評論把這篇年度總結(jié)文編譯如下(并添加了我們相關報道的鏈接,以便仔細查閱)。
今年 5 月時候,圍棋排名世界第一的柯潔在烏鎮(zhèn)的圍棋峰會上迎戰(zhàn)了 AlphaGo。比賽結(jié)果我們都知道了,三場全輸。而僅僅 2 個月后,柯潔已經(jīng)在同人類棋手的比賽中獲得了 20 連勝。這時的他面對媒體說了這樣一番話:「我下完(人機大戰(zhàn))以后對圍棋有了重新的思考,現(xiàn)在看來這些思考對我還是有幫助的。我也希望所有的棋手都能去思考一下‘阿爾法狗’的棋理,它的思想,其實都很有意義。雖然我輸了,但我發(fā)現(xiàn)圍棋的變化量真的太大了,它還在不停地進步,我也希望自己不斷地進步」。
柯潔是圍棋領域的頂級人物,他的話讓 DeepMind 的研究人員們倍感榮幸。這同時也是對 DeepMind 研究人員們的激勵,因為這預示著一個新時代的開始。在未來,AI 可以成為幫助人類探索的工具;它可以發(fā)掘出新的知識,幫人類增進對世界的理解。具體對于 AI 輔助科研來說,DeepMind 也希望 AI 系統(tǒng)可以在氣候變化、新藥研發(fā)、到發(fā)現(xiàn)新型復合材料、降低現(xiàn)有醫(yī)療系統(tǒng)的運轉(zhuǎn)壓力等等挑戰(zhàn)上幫助人類做出進展。
這種帶來更美好的社會的可能性就是當初 DeepMind 成立的原因。而 DeepMind 也一直在持續(xù)做出進展,有些是在基礎科學方面,也有一些在 AI 安全和倫理方面。
科學技術研究成果
DeepMind 的研究方法是受到神經(jīng)科學啟發(fā)的,神經(jīng)科學領域的發(fā)現(xiàn)幫助 DeepMind 在想象力、推理、記憶和學習等關鍵要素上做出新的成果。以想象力為例,這種人類獨有的能力在我們的日常生活中起著重要作用,讓我們可以對未來可能發(fā)生的事情做規(guī)劃和推理,但這對計算機來說就是巨大的挑戰(zhàn)。DeepMind 持續(xù)地在這個問題上進行深入的研究,今年也研發(fā)出了帶有想象力的智能體,它們可以從環(huán)境中提取出有用的信息,然后對未來應該做什么做出規(guī)劃。
正是沿著在神經(jīng)科學啟發(fā)下做研究的思路,DeepMind 嘗試訓練了一個神經(jīng)網(wǎng)絡,讓它在虛擬環(huán)境中控制各種簡單形體的運動,得到了走路非常妖嬈的智能體,這項研究的訓練成果的視頻也是 DeepMind 歷來最熱門的一次。這種復雜的運動控制是運動智能的標志,也是 DeepMind 的研究計劃中的重要部分。雖然最終得到的運動姿態(tài)有點「野路子」,有時候也看起來很別扭,但它們同樣走得很順利,也很能讓人們看個開心。
另一方面,DeepMind 在生成性模型方面也做出了成果。差不多一年之前 DeepMind 提出了 WaveNet,這是一個用來生成原始音頻信號的深度神經(jīng)網(wǎng)絡,而它的生成質(zhì)量也比當時的其它技術要高得多、真實得多。這個模型當時只是一個實驗室級別的原型,需要消耗非常高的計算資源所以無法用于消費級產(chǎn)品。而在過去的 12 個月中,DeepMind 和谷歌的團隊一起成功地開發(fā)出了一個快 1000 倍的新模型。今年 10 月,DeepMind 正式宣布這個新的并行 WaveNet(Parallel WaveNet)開始在真實世界落地商用,為 Google Assistant 提供逼真的美國英語和日語語音生成。
這是 DeepMind 把 AI 系統(tǒng)變得更容易構(gòu)建、更容易訓練、更容易優(yōu)化的努力成果之一。DeepMind 在過去的一年里還研究了概率分布強化學習、基于群落的神經(jīng)網(wǎng)絡訓練方法以及新的神經(jīng)網(wǎng)絡架構(gòu)搜索方法,這都讓 AI 系統(tǒng)變得更容易構(gòu)建、預測更準確,優(yōu)化起來也更快。DeepMind 還投入了相當?shù)臅r間創(chuàng)造新的、有挑戰(zhàn)性的環(huán)境用來測試他們開發(fā)出的 AI 系統(tǒng),其中就包含了和暴雪合作,把星際 2 游戲開放成為研究平臺。
但 DeepMind 明白科學技術不是價值中立的。當他們在基礎研究上做出成果的時候,他們知道自己同樣需要為研究成果的倫理和社會影響負起責任。這也讓 DeepMind 的研究工作深入了解釋性之類的重要領域,開發(fā)各種各樣的新方法來理解以及解釋他們的 AI 系統(tǒng)是如何工作的?;谕瑯拥睦碛?,DeepMind 成立了一支技術安全研究小組,他們會持續(xù)研究各種實際的辦法來保證未來的 AI 系統(tǒng)是可信賴可依靠的,以及它們不會脫離人類的控制。
10 月的時候,DeepMind 邁出了新的一步,成立了「DeepMind 倫理&社會」研究小組,這支團隊會為 DeepMind 探究以及理解 AI 對真實世界的影響,以便讓 AI 真正地在社會中發(fā)揮益處。這項研究會由這個領域的知名專家們引領,比如哲學家 Nick Bostrom、氣候變化專家 Christiana Figueres、優(yōu)秀研究員 James Manyika 以及經(jīng)濟學家 Diane Coyle 和 Jeffrey Sachs。
AI 必須被整個社會的重點需求和擔憂重新塑造,所以 DeepMind 和一些合作伙伴共同舉辦活動,試圖啟動全社會的討論和對話,共同思考 AI 應該如何設計、如何應用。比如,算法正義聯(lián)盟(Algorithmic Justice League)的負責人 Joy Buolamwini、Article 36 和人權(quán)觀察組織(Human Rights Watch)的專家,以及英國軍方都參加了一個連線直播上的活動,討論算法的偏見性以及限制自動殺傷性武器的使用。正如 DeepMind 今年反復說起的那樣,這些議題都非常重大,它們的影響也非常廣闊,根本不可以忽視。
也所以,DeepMind 需要開拓新的空間,不管是在 AI 公司之間還是之外,以便探討如何參與以及引導科學技術對世界的影響。其中一個例子是「AI 合作伙伴」(Partnership on AI),DeepMind 今年在這個組織擔任聯(lián)合主席,而它的目的就是把業(yè)界的競爭者們、學術機構(gòu)和現(xiàn)代社會三者聯(lián)合起來,共同討論關鍵的倫理問題。在過去的一年中,「AI 合作伙伴」新增了 43 個盈利和非盈利成員,以及一位新的執(zhí)行總監(jiān) Terah Lyons。在接下來的幾個月中,DeepMind 期待和整個組織進一步合作,驗證更多各種各樣的研究主題,包括算法中的偏見和歧視、機器學習對自動化和勞動力的影響,等等。
DeepMind 同樣看重如何讓科學技術為社會帶來實際的益處,也持續(xù)地發(fā)現(xiàn)著 AI 在醫(yī)療和能源方面帶來巨大影響的潛力。今年,DeepMind 和 NHS 醫(yī)院信托簽訂了兩項合作伙伴協(xié)定讓 DeepMind 的 Streams app 落地應用,它可以用數(shù)字化技術幫助 NHS 醫(yī)院的醫(yī)生們做出診斷。DeepMind 頂級研究機構(gòu)的合作組織中的一員,今年他們也發(fā)起了一項開創(chuàng)性的研究,要確定最新的機器學習技術是否真的能夠幫助提升乳腺癌的檢測精度。
同時,DeepMind 也把許多精力投入了自己在保健方面的研究的監(jiān)管上。DeepMind 也曾經(jīng)撰文介紹,政府信息專員在 DeepMind 與皇家自由醫(yī)院的合作中有一些發(fā)現(xiàn),以及 DeepMind 保健的獨立評審員首次對 DeepMind 的工作發(fā)布了公開年度報告,DeepMind 也從其中獲得了經(jīng)驗教訓。他們的仔細監(jiān)督提高了 DeepMind 的工作質(zhì)量。DeepMind 隨之大幅增加了自己和病人以及公眾之間的互動活動,包括與病人和看護人員的 workshop;而且 DeepMind 也在開發(fā)新的技術手段來把信任機制構(gòu)建到系統(tǒng)中來,比如可驗證的數(shù)據(jù)監(jiān)督機制(verifiable data audit),DeepMind 未來也計劃把它作為一個開源工具公開發(fā)布出來。
對 DeepMind 來說,2017 年的成果很讓他們覺得滿意,但同時他們也明白還有很長的路要走。
在擊敗柯潔、讓 AlphaGo 從競技比賽退役之后的 5 個月后,DeepMind 發(fā)布了第四篇《Nature》論文,介紹了 AlphaGo 系列的新版本 AlphaGo Zero,它學習圍棋技能不需要任何人類的知識。在上百萬局游戲中,這個系統(tǒng)從零開始逐漸學會了如何下圍棋,在僅僅幾天的時間內(nèi)就積累了人類需要數(shù)千年的時間才能積累出的知識。在這個過程中,它同時也在這項古老的游戲中發(fā)現(xiàn)了非傳統(tǒng)的策略、發(fā)掘出了新的知識。
DeepMind 相信 AI 在更復雜的問題上也能起到同樣的作用,它可以是科學技術工具,也可以是人類創(chuàng)造力的倍增器。AlphaGo 團隊現(xiàn)在已經(jīng)把注意力轉(zhuǎn)向了另一組宏偉的目標,DeepMind 自己也希望這些研究人員們感受到了算法靈感的時刻才是剛剛開始。
via DeepMind Blog,雷鋒網(wǎng) AI 科技評論編譯
相關文章:
DeepMind 彈性權(quán)重鞏固算法讓 AI 擁有“記憶” ,將成機器高效學習的敲門磚
重磅 | DeepMind新神經(jīng)網(wǎng)絡學會關系推理,還擊敗了人類
DeepMind解密黑箱第一步:原來神經(jīng)網(wǎng)絡的認知原理和人類是一樣的!
DeepMind醫(yī)療數(shù)據(jù)項目被當局批評 合作醫(yī)院被勒令整改
機器人走路未必笨拙,DeepMind新方法訓練的人工智能走得就很飄逸
DeepMind提出SCAN:僅需五對樣本,學會新的視覺概念!
DeepMind新論文:在復雜環(huán)境中,智能體能更聰明地進行想象和思考了
DeepMind眼中的神經(jīng)科學研究:人工智能進步的另一個重要支點
DeepMind和暴雪聯(lián)手發(fā)布開發(fā)工具和replay數(shù)據(jù)集,讓更多AI研究者玩上星際2
Deepmind語音生成模型WaveNet正式商用:效率提高1000倍
100:0!Deepmind Nature論文揭示最強AlphaGo Zero,無需人類知識
手動調(diào)參慢,隨機搜索浪費資源?Deepmind異步優(yōu)化算法PBT解決神經(jīng)網(wǎng)絡痛點
生活中出現(xiàn)AI時我們能信任它們嗎?DeepMind 已經(jīng)開始探索AI安全的答案
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。