2
本文作者: 宗仁 | 2016-07-25 10:55 | 專題:「CCF - GAIR」全球人工智能與機(jī)器人峰會(huì)報(bào)道專題 |
牛津大學(xué)計(jì)算機(jī)科學(xué)系主任、DeepMind-Oxford Partnership監(jiān)事——邁克爾·伍爾德里奇(Michael Wooldridge)。是現(xiàn)金今著名智能體理論研究學(xué)者,著作有《多Agent系統(tǒng)引論》,是當(dāng)今關(guān)于多Agent系統(tǒng)這個(gè)重要論題的第一本教材。
在其二十年的工作生涯里,他幾乎獲得了人工智能領(lǐng)域的所有榮譽(yù):ACM(國際計(jì)算機(jī)學(xué)會(huì))、AAAI(美國人工智能學(xué)會(huì))、EURAI(歐洲人工智能學(xué)會(huì))成員,Academia Europaea(歐洲科學(xué)院)成員、ERC(歐洲研究學(xué)會(huì))委員,堪稱人工智能領(lǐng)域的達(dá)人。
作為雷鋒網(wǎng)8月份的CCF—GAIR大會(huì)的學(xué)術(shù)大牛嘉賓之一,近日我們對(duì)其進(jìn)行了專門采訪。
這個(gè)智能體的核心是“社會(huì)性”。人和動(dòng)物區(qū)別開來的一個(gè)重要特征就是我們作為智能的,社會(huì)性動(dòng)物,我們有語言,可以相互合作,協(xié)調(diào),談判來實(shí)現(xiàn)一些遠(yuǎn)超月個(gè)人能力范圍內(nèi)可以實(shí)現(xiàn)的事情。
所以AI如果忽視了“社會(huì)性”這個(gè)屬性,它在接近或者超越我們的路上將會(huì)缺失許多東西。
我不知道其它智能體研究者是否會(huì)稱它為智能體,但我把它定義為單智能體,因?yàn)樗鼪]有體現(xiàn)在任何環(huán)境中,也不曾以任何方式作用在這個(gè)世界上過。因?yàn)橥ǔN覀兌颊J(rèn)為智能體是存在于某些環(huán)境中的。
現(xiàn)在深度學(xué)習(xí)研究者們有個(gè)有趣的挑戰(zhàn),如何有一個(gè)學(xué)習(xí)系統(tǒng)可以分享他們的經(jīng)驗(yàn)——分享他們學(xué)習(xí)到的經(jīng)驗(yàn),就像人類在學(xué)習(xí)完英語后,又把他們的經(jīng)驗(yàn)用去學(xué)韓語,西班牙語等其它語言。
貿(mào)易機(jī)器人就是個(gè)很典型的例子,這個(gè)程序可以買東西和賣東西,現(xiàn)在國際貿(mào)易中正大量用到這個(gè)程序,AI就應(yīng)用地更廣了,我希望來年這個(gè)增長有更大的發(fā)展。
健康—智能手機(jī)和其它的設(shè)備里的各種傳感器,都在監(jiān)視我們的健康狀態(tài)。
娛樂,看看口袋妖怪里的AI技術(shù)就知道了。
醫(yī)療,人工智能正在為我們尋找新的藥物(和藥物形式)。
自動(dòng)駕駛,美國有359萬卡車司機(jī),我相信20年后,這些都會(huì)被自動(dòng)駕駛代替,這對(duì)社會(huì)是個(gè)巨大的改變。
物流/規(guī)劃,AI在這塊領(lǐng)域會(huì)找到更有效的處理方式。
本質(zhì)上區(qū)別還是我上面提的“社會(huì)屬性”,之前的AI一開始沒有對(duì)這點(diǎn)花太多注意力,但智能體(系統(tǒng))一直在聚焦這件事。
在一些我們有特定任務(wù)要完成的領(lǐng)域AI非常成功,有時(shí)我們甚至能評(píng)估浙西任務(wù)的完成情況,但遷移到有些我們都不太好定義的地方應(yīng)用,目前沒有太多成功的例子可以拿來佐證。
關(guān)于這點(diǎn),誰要是覺得除了AlphaGo會(huì)贏后還會(huì)有其它的結(jié)果,剩下的只是參賽者會(huì)覺得很驚喜,柯潔也會(huì)經(jīng)歷這個(gè)過程。我更感興趣的是AlphaGo能不能教人類下得更好,但現(xiàn)在我們不知道它是如何做到的,這是個(gè)問題。
他們不是完全不同的兩種東西,強(qiáng)化學(xué)習(xí)的基本思想是,傾向于加強(qiáng)過去已經(jīng)成功的執(zhí)行操作的概率。
而深度學(xué)習(xí)是在神經(jīng)網(wǎng)絡(luò)的背景下,關(guān)心一個(gè)類似的想法。他們都有著類似的想法,以及需要重復(fù)訓(xùn)練這個(gè)過程。最后在我眼里,技術(shù)是互補(bǔ)的,而不是競爭的。
至少目前,我們不知道如何通往AGI,也沒人敢說他知道這個(gè),機(jī)器學(xué)習(xí)近幾年雖然有重大進(jìn)展,但是我們不知道意識(shí)或者自我意識(shí)是如何組織的,如何進(jìn)步的,以及它和大腦的微觀結(jié)構(gòu)有什么關(guān)系,所以AGI還有很長一段時(shí)間要走。
在多智能體系統(tǒng)里,有不同的方式組織活動(dòng),避免系統(tǒng)延遲一直是個(gè)問題,一種方法是任務(wù)共享,這時(shí)任務(wù)被分解成更小的任務(wù),分享給更小的代理。甚至有時(shí)需要重新組裝這些任務(wù)。
另一種方法就是“結(jié)果分享”,代理所做的就是分享信息,如果我認(rèn)為這個(gè)信息對(duì)你有用的,我跟你一起分享。這些方法都有優(yōu)點(diǎn)和缺點(diǎn),在多智能體系統(tǒng)研究的關(guān)鍵中,懂得在一個(gè)特俗問題中哪個(gè)才是最適合的解決方法很關(guān)鍵。
在我的經(jīng)驗(yàn)中,多智能體系統(tǒng)里,有不同的方式組織活動(dòng),避免系統(tǒng)延遲一直是個(gè)問題。一種解決方法是任務(wù)共享——這時(shí)任務(wù)被分解成更小的任務(wù),分享給更小的代理。甚至有時(shí)需要重新組裝這些任務(wù)。
另一種方法就是“結(jié)果分享”——代理所做的就是分享信息,如果我認(rèn)為這個(gè)信息對(duì)你有用的,我跟你一起分享。
最后,這些方法都有優(yōu)點(diǎn)和缺點(diǎn),在多智能體系統(tǒng)研究的關(guān)鍵中,懂得在一個(gè)特定問題中哪個(gè)才是最適合的解決方法很關(guān)鍵。
智能體是人工智能領(lǐng)域中一個(gè)很重要的概念。通常我們認(rèn)為任何獨(dú)立的能夠思想并可以同環(huán)境交互的實(shí)體都可以抽象為智能體。邁克爾·伍爾德里奇過去花了20多年時(shí)間專注人工智能的這個(gè)前沿領(lǐng)域———智能體 (Agent) 的研究。
正好這個(gè)Agent(S)系統(tǒng)在博弈,調(diào)度優(yōu)化,金融,游戲,多機(jī)器人控制方面都非常適合,所以AlphaGo這種博弈類高手機(jī)器系統(tǒng)誕生在牛津大學(xué)也說的上“順利成章“,而未來,在人工智能這個(gè)“超級(jí)網(wǎng)絡(luò)”中,我們有理由在各個(gè)場(chǎng)景中都會(huì)充斥著multi-agent的概念。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章