丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給no name
發(fā)送

1

論文精選 | AI學(xué)習(xí)也要先定個(gè)小目標(biāo),讓人工智能具有社會(huì)意識(shí)——《具有社會(huì)意識(shí)的多智能體學(xué)習(xí):面向社會(huì)最優(yōu)解》

本文作者: no name 2016-09-01 17:43
導(dǎo)語(yǔ):多智能體系統(tǒng)是由多個(gè)具有計(jì)算和移動(dòng)能力的智能體所組成的集合,其中每個(gè)智能體是一個(gè)物理的或抽象的實(shí)體,能作用于自身和環(huán)境,并與其它智能體通訊。

應(yīng)用場(chǎng)景導(dǎo)讀:多智能體系統(tǒng),例如移動(dòng)傳感器、無(wú)人運(yùn)載器等,作為分布式人工智能研究的一個(gè)重要分支,由于其具有較強(qiáng)的容錯(cuò)性、魯棒性和可擴(kuò)展性等優(yōu)點(diǎn),被廣泛地應(yīng)用于軍事、工農(nóng)業(yè)生產(chǎn)、醫(yī)學(xué)、交通、服務(wù)等各個(gè)領(lǐng)域。多智能體系統(tǒng)是由多個(gè)具有計(jì)算和移動(dòng)能力的智能體所組成的集合,其中每個(gè)智能體是一個(gè)物理的或抽象的實(shí)體,能作用于自身和環(huán)境,并與其它智能體通訊。

論文精選 | AI學(xué)習(xí)也要先定個(gè)小目標(biāo),讓人工智能具有社會(huì)意識(shí)——《具有社會(huì)意識(shí)的多智能體學(xué)習(xí):面向社會(huì)最優(yōu)解》

標(biāo)題:

具有社會(huì)意識(shí)的多智能體學(xué)習(xí):面向社會(huì)最優(yōu)解

摘要:

在多智能體系統(tǒng)中,學(xué)習(xí)能力對(duì)每個(gè)智能體來(lái)說(shuō)至關(guān)重要,這關(guān)乎其在動(dòng)態(tài)環(huán)境中面對(duì)未知對(duì)手時(shí)如何正常反應(yīng)。從系統(tǒng)設(shè)計(jì)者的角度說(shuō),非常希望智能體能學(xué)會(huì)面向社會(huì)最優(yōu)解的協(xié)作,同時(shí)避免被自私的對(duì)手利用。為此,我們提出一種新穎的梯度提升算法(SA-IGA),通過(guò)將社會(huì)意識(shí)納入策略更新過(guò)程來(lái)加強(qiáng)基本的梯度提升算法。我們從理論上分析了基于動(dòng)態(tài)系統(tǒng)理論的SA-IGA的學(xué)習(xí)動(dòng)態(tài),并且SA-IGA在包括對(duì)稱游戲的眾多游戲中都有線性動(dòng)態(tài)。對(duì)兩個(gè)代表游戲(“囚徒困境”游戲和協(xié)調(diào)游戲)的學(xué)習(xí)動(dòng)態(tài)進(jìn)行了詳細(xì)分析。在SA-IGA概念的基礎(chǔ)上,我們進(jìn)一步提出一個(gè)基于Q學(xué)習(xí)更新規(guī)則的多智能體學(xué)習(xí)算法,稱為SA-PGA。仿真結(jié)果表明,SA-PGA智能體相比以前面向有條件聯(lián)合行動(dòng)學(xué)習(xí)者(CJAL)的社會(huì)最優(yōu)準(zhǔn)則,可以獲得更高的社會(huì)福利,并通過(guò)納什均衡解決方案對(duì)獨(dú)立理性對(duì)手具有可抗性。


第一作者簡(jiǎn)介:

李曉紅,女,1965年9月出生,工學(xué)博士學(xué)位,天津大學(xué)計(jì)算機(jī)及信息技術(shù)系、教授,博士生導(dǎo)師。計(jì)算機(jī)學(xué)會(huì)高級(jí)會(huì)員,ACM會(huì)員、軟件工程專委會(huì)委員;全國(guó)高等學(xué)校計(jì)算機(jī)教育研究會(huì) 常務(wù)理事;天津大學(xué)女工委員,學(xué)院工會(huì)副主席。近年來(lái)致力于安全軟件工程、可信軟件及信息安全領(lǐng)域的研究工作。

計(jì)算機(jī)學(xué)會(huì)高級(jí)會(huì)員,ACM會(huì)員、軟件工程專委會(huì)委員;全國(guó)高等學(xué)校計(jì)算機(jī)教育研究會(huì) 常務(wù)理事;國(guó)家科技獎(jiǎng)勵(lì)評(píng)審專家;教育部學(xué)位與研究生教育發(fā)展中心學(xué)位論文評(píng)審、學(xué)科建設(shè)和評(píng)估咨詢專家 ;《計(jì)算機(jī)學(xué)報(bào)》、《計(jì)算機(jī)科學(xué)》等雜志審稿專家;軟件工程、信息安全相關(guān)領(lǐng)域國(guó)際期刊、國(guó)際會(huì)議審稿專家;計(jì)算機(jī)學(xué)院學(xué)位委員會(huì)委員、學(xué)術(shù)委員會(huì)委員、學(xué)科建設(shè)委員會(huì)成員、教學(xué)指導(dǎo)委員會(huì)委員兼秘書(shū);學(xué)院985專家組成員兼秘書(shū);天津大學(xué)女工委員,學(xué)院工會(huì)副主席。

近年來(lái)主持或參與完成國(guó)家級(jí)、省部級(jí)以及橫向科研課題近20項(xiàng),近年來(lái)已發(fā)表學(xué)術(shù)論文50余篇,其中學(xué)位與研究生教育重要期刊20多篇,國(guó)際會(huì)議20多篇,被EI檢索20多篇, SCI檢索6篇。申報(bào)國(guó)家發(fā)明專利20余項(xiàng),已授權(quán)6項(xiàng)。軟件著作權(quán)4項(xiàng)。專著1部,獲省部級(jí)科技獎(jiǎng)1項(xiàng)?,F(xiàn)作為項(xiàng)目負(fù)責(zé)人主持國(guó)家基金重點(diǎn)項(xiàng)目1項(xiàng)(子課題負(fù)責(zé)人)、國(guó)家基金面上項(xiàng)目1項(xiàng),天津市基礎(chǔ)重點(diǎn)項(xiàng)目1項(xiàng)、企業(yè)合作項(xiàng)目1項(xiàng)。


via PRICAI 2016

論文原文件下載

雷鋒網(wǎng)按: 本文由雷鋒網(wǎng)獨(dú)家編譯,未經(jīng)許可禁止轉(zhuǎn)載!

論文精選 | AI學(xué)習(xí)也要先定個(gè)小目標(biāo),讓人工智能具有社會(huì)意識(shí)——《具有社會(huì)意識(shí)的多智能體學(xué)習(xí):面向社會(huì)最優(yōu)解》

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

論文精選 | AI學(xué)習(xí)也要先定個(gè)小目標(biāo),讓人工智能具有社會(huì)意識(shí)——《具有社會(huì)意識(shí)的多智能體學(xué)習(xí):面向社會(huì)最優(yōu)解》

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)