2
本文作者: 宗仁 | 2016-07-25 10:55 | 專題:「CCF - GAIR」全球人工智能與機器人峰會報道專題 |
牛津大學計算機科學系主任、DeepMind-Oxford Partnership監(jiān)事——邁克爾·伍爾德里奇(Michael Wooldridge)。是現(xiàn)金今著名智能體理論研究學者,著作有《多Agent系統(tǒng)引論》,是當今關于多Agent系統(tǒng)這個重要論題的第一本教材。
在其二十年的工作生涯里,他幾乎獲得了人工智能領域的所有榮譽:ACM(國際計算機學會)、AAAI(美國人工智能學會)、EURAI(歐洲人工智能學會)成員,Academia Europaea(歐洲科學院)成員、ERC(歐洲研究學會)委員,堪稱人工智能領域的達人。
作為雷鋒網(wǎng)8月份的CCF—GAIR大會的學術大牛嘉賓之一,近日我們對其進行了專門采訪。
這個智能體的核心是“社會性”。人和動物區(qū)別開來的一個重要特征就是我們作為智能的,社會性動物,我們有語言,可以相互合作,協(xié)調(diào),談判來實現(xiàn)一些遠超月個人能力范圍內(nèi)可以實現(xiàn)的事情。
所以AI如果忽視了“社會性”這個屬性,它在接近或者超越我們的路上將會缺失許多東西。
我不知道其它智能體研究者是否會稱它為智能體,但我把它定義為單智能體,因為它沒有體現(xiàn)在任何環(huán)境中,也不曾以任何方式作用在這個世界上過。因為通常我們都認為智能體是存在于某些環(huán)境中的。
現(xiàn)在深度學習研究者們有個有趣的挑戰(zhàn),如何有一個學習系統(tǒng)可以分享他們的經(jīng)驗——分享他們學習到的經(jīng)驗,就像人類在學習完英語后,又把他們的經(jīng)驗用去學韓語,西班牙語等其它語言。
貿(mào)易機器人就是個很典型的例子,這個程序可以買東西和賣東西,現(xiàn)在國際貿(mào)易中正大量用到這個程序,AI就應用地更廣了,我希望來年這個增長有更大的發(fā)展。
健康—智能手機和其它的設備里的各種傳感器,都在監(jiān)視我們的健康狀態(tài)。
娛樂,看看口袋妖怪里的AI技術就知道了。
醫(yī)療,人工智能正在為我們尋找新的藥物(和藥物形式)。
自動駕駛,美國有359萬卡車司機,我相信20年后,這些都會被自動駕駛代替,這對社會是個巨大的改變。
物流/規(guī)劃,AI在這塊領域會找到更有效的處理方式。
本質(zhì)上區(qū)別還是我上面提的“社會屬性”,之前的AI一開始沒有對這點花太多注意力,但智能體(系統(tǒng))一直在聚焦這件事。
在一些我們有特定任務要完成的領域AI非常成功,有時我們甚至能評估浙西任務的完成情況,但遷移到有些我們都不太好定義的地方應用,目前沒有太多成功的例子可以拿來佐證。
關于這點,誰要是覺得除了AlphaGo會贏后還會有其它的結果,剩下的只是參賽者會覺得很驚喜,柯潔也會經(jīng)歷這個過程。我更感興趣的是AlphaGo能不能教人類下得更好,但現(xiàn)在我們不知道它是如何做到的,這是個問題。
他們不是完全不同的兩種東西,強化學習的基本思想是,傾向于加強過去已經(jīng)成功的執(zhí)行操作的概率。
而深度學習是在神經(jīng)網(wǎng)絡的背景下,關心一個類似的想法。他們都有著類似的想法,以及需要重復訓練這個過程。最后在我眼里,技術是互補的,而不是競爭的。
至少目前,我們不知道如何通往AGI,也沒人敢說他知道這個,機器學習近幾年雖然有重大進展,但是我們不知道意識或者自我意識是如何組織的,如何進步的,以及它和大腦的微觀結構有什么關系,所以AGI還有很長一段時間要走。
在多智能體系統(tǒng)里,有不同的方式組織活動,避免系統(tǒng)延遲一直是個問題,一種方法是任務共享,這時任務被分解成更小的任務,分享給更小的代理。甚至有時需要重新組裝這些任務。
另一種方法就是“結果分享”,代理所做的就是分享信息,如果我認為這個信息對你有用的,我跟你一起分享。這些方法都有優(yōu)點和缺點,在多智能體系統(tǒng)研究的關鍵中,懂得在一個特俗問題中哪個才是最適合的解決方法很關鍵。
在我的經(jīng)驗中,多智能體系統(tǒng)里,有不同的方式組織活動,避免系統(tǒng)延遲一直是個問題。一種解決方法是任務共享——這時任務被分解成更小的任務,分享給更小的代理。甚至有時需要重新組裝這些任務。
另一種方法就是“結果分享”——代理所做的就是分享信息,如果我認為這個信息對你有用的,我跟你一起分享。
最后,這些方法都有優(yōu)點和缺點,在多智能體系統(tǒng)研究的關鍵中,懂得在一個特定問題中哪個才是最適合的解決方法很關鍵。
智能體是人工智能領域中一個很重要的概念。通常我們認為任何獨立的能夠思想并可以同環(huán)境交互的實體都可以抽象為智能體。邁克爾·伍爾德里奇過去花了20多年時間專注人工智能的這個前沿領域———智能體 (Agent) 的研究。
正好這個Agent(S)系統(tǒng)在博弈,調(diào)度優(yōu)化,金融,游戲,多機器人控制方面都非常適合,所以AlphaGo這種博弈類高手機器系統(tǒng)誕生在牛津大學也說的上“順利成章“,而未來,在人工智能這個“超級網(wǎng)絡”中,我們有理由在各個場景中都會充斥著multi-agent的概念。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章