0
本文作者: 木子 | 2021-08-23 09:53 |
「注:文章來(lái)自國(guó)際電信聯(lián)盟(ITU)」
當(dāng)談到新興技術(shù)在改善世界各地人們生活的潛力時(shí),你首先想到的可能不是電子游戲。然而,虛擬游戲可以在訓(xùn)練人工智能 (AI) 以對(duì)現(xiàn)實(shí)世界產(chǎn)生積極影響方面發(fā)揮重要作用。
每年,國(guó)際電信聯(lián)盟(ITU)都會(huì)舉辦 AI for Good (“AI向善”)峰會(huì),以展示人工智能在支持聯(lián)合國(guó)可持續(xù)發(fā)展目標(biāo)方面的技術(shù)進(jìn)步。國(guó)際電信聯(lián)盟(ITU)還制定了電子游戲體驗(yàn)的標(biāo)準(zhǔn)。
在觀看近期國(guó)際電信聯(lián)盟(ITU)有關(guān)在線游戲服務(wù)質(zhì)量標(biāo)準(zhǔn)的網(wǎng)絡(luò)研討會(huì)時(shí),世界各地的研究人員目前需要努力將人工智能和電子游戲這兩個(gè)領(lǐng)域結(jié)合起來(lái),以營(yíng)造可以幫助機(jī)器從游戲數(shù)據(jù)中學(xué)習(xí)并提供洞悉人工智能開發(fā)的環(huán)境。目標(biāo)是使用虛擬游戲結(jié)構(gòu)來(lái)提高人工智能的自學(xué)能力,然后可以將其應(yīng)用在現(xiàn)實(shí)世界中的應(yīng)用(場(chǎng)景),例如促進(jìn)醫(yī)療保健的進(jìn)步以及城市的智慧化與可持續(xù)發(fā)展中。
那么電子游戲如何加快人工智能的發(fā)展步伐,讓全世界的人們?cè)谌粘I钪卸寄芸吹剿麄兊挠幸嬷幠兀?/p>
長(zhǎng)期以來(lái),游戲一直是衡量人工智能 (AI) 技術(shù)進(jìn)步的方式,通過(guò)在策略中與頂尖人類玩家進(jìn)行較量來(lái)展示計(jì)算機(jī)算法的“智能”程度。
“整個(gè)電子游戲提供了我們所擁有的最好的智力測(cè)試?!?/p>
——Julian Togelius紐約大學(xué)坦登工程學(xué)院副教授
紐約大學(xué)坦登工程學(xué)院副教授朱利安·托格利烏斯 (Julian Togelius) 說(shuō):“整個(gè)電子游戲提供了我們所擁有的最好的智力測(cè)試?!?“電子游戲是訓(xùn)練 AI 算法的一種很好的方式,因?yàn)樗鼈冎荚谘驖u進(jìn)地讓人類的思維經(jīng)歷越來(lái)越難的挑戰(zhàn)。”
Togelius 解釋說(shuō),電子游戲旨在通過(guò)讓玩家專注于克服障礙和跟隨后續(xù)故事等元素來(lái)挑戰(zhàn)人類的思維。他說(shuō),游戲設(shè)計(jì)的一個(gè)核心理念——也是許多人喜歡玩游戲的部分原因——是玩家一直在學(xué)習(xí)。
他說(shuō),這使得電子游戲成為訓(xùn)練 AI 的理想環(huán)境。游戲提供結(jié)構(gòu)框架、重復(fù)訓(xùn)練以及能力強(qiáng)化,這都有助于(AI的)算法學(xué)習(xí)。
Togelius 說(shuō),與在物理空間中學(xué)習(xí)完成任務(wù)的機(jī)器人相比,虛擬環(huán)境還允許算法以更低的成本更快地開發(fā)。
“用機(jī)器人執(zhí)行 10 次任務(wù)的時(shí)間,可以讓算法玩 10,000 次游戲,”他說(shuō),“你不必?fù)?dān)心它會(huì)不會(huì)(如機(jī)器人實(shí)驗(yàn)一般)損壞或過(guò)熱?!?/p>
虛擬游戲?qū)θ斯ぶ悄艿奈锢硇詢?yōu)勢(shì)已經(jīng)開始顯現(xiàn)。
例如,OpenAI 的研究人員最近展示了一種算法,該算法可以通過(guò)相當(dāng)于100年的反復(fù)試驗(yàn),去教會(huì)自己操縱一個(gè)立方體。
Togelius 說(shuō),展望未來(lái),虛擬訓(xùn)練可以直接應(yīng)用于現(xiàn)實(shí)世界的實(shí)踐,例如使用虛擬駕駛游戲來(lái)訓(xùn)練人工智能以用于自動(dòng)駕駛汽車。
騰訊自動(dòng)駕駛TAD Sim仿真場(chǎng)景
自動(dòng)駕駛汽車的技術(shù)進(jìn)步有提升道路安全性、減少交通擁堵、減少排放等其他好處。實(shí)現(xiàn)自動(dòng)駕駛,是國(guó)際電信聯(lián)盟(ITU)在幫助實(shí)現(xiàn)聯(lián)合國(guó)可持續(xù)發(fā)展目標(biāo)的第 11項(xiàng)——“建設(shè)更智能、更可持續(xù)的城市”中的一部分貢獻(xiàn)。
Togelius 解釋說(shuō),但(我們)也有機(jī)會(huì)跳出框架思考,將電子游戲中學(xué)到的經(jīng)驗(yàn)應(yīng)用于新領(lǐng)域。例如,在星際爭(zhēng)霸(StarCraft)(這是一款復(fù)雜的多人在線游戲)中訓(xùn)練人工智能,玩家必須使用策略來(lái)推進(jìn)賽程,這可以培養(yǎng)管理技能,他說(shuō)。
“你正在制定戰(zhàn)術(shù)和戰(zhàn)略位置,建立和協(xié)調(diào)后勤網(wǎng)絡(luò),并確保資源正常運(yùn)轉(zhuǎn),”Togelius說(shuō)。“如果一款游戲有許多與現(xiàn)實(shí)世界任務(wù)相同的挑戰(zhàn),那么它就證明了[算法]可以學(xué)習(xí)類似于現(xiàn)實(shí)世界的任務(wù)。”
觀察算法在電子游戲中的表現(xiàn)還可以深入了解它們的行為方式。Togelius 說(shuō),這有助于研究人員更好地了解算法如何解決問(wèn)題并做出決策。
“通過(guò)觀看 AI 代理玩游戲,我們可以更多地了解 AI 擅長(zhǎng)什么以及人類擅長(zhǎng)什么,”他說(shuō)。
這一點(diǎn)可以幫助公司和政策制定者去識(shí)別在哪些領(lǐng)域人工智能能夠以有利于人類的方式,來(lái)提高效率或支持現(xiàn)有的工作。在這些場(chǎng)景中觀察 AI 的另一個(gè)好處可能是發(fā)現(xiàn)新技術(shù)或新機(jī)會(huì)。
例如,根據(jù)德國(guó)弗萊堡大學(xué)機(jī)器學(xué)習(xí)研究人員今年早些時(shí)候發(fā)表的一篇論文所述,一種使用進(jìn)化策略的算法,其中最成功的算法能夠生存和進(jìn)化,利用電子游戲 Q*bert 中的一個(gè)bug,來(lái)累積幾乎無(wú)限的積分。
該論文的作者之一弗蘭克·哈特 (Frank Hutter) 表示,在這款游戲推出 36 年的時(shí)間里,包括開發(fā)者在內(nèi)的任何人都沒(méi)有發(fā)現(xiàn)這個(gè)漏洞。
Hutter 解釋說(shuō),該算法的探索行為,以及為了長(zhǎng)期最大化積分而不斷嘗試的意愿,幫助它找到了故障。
“按照設(shè)計(jì),它著眼于長(zhǎng)期依賴關(guān)系,”他說(shuō)?!八粚?duì)‘最終分?jǐn)?shù)’感興趣,而其他方法則專注于‘如何快速獲得積分’,這就是人類嘗試玩游戲的方式?!?/p>
人類和人工智能,都仍有很多東西需要學(xué)習(xí)。例如, OpenAI 在 Dota 2 中戰(zhàn)勝一支人類玩家隊(duì)伍的幾周后,它在電子游戲的年度錦標(biāo)賽中輸給了職業(yè)玩家。
Togelius 說(shuō),展望未來(lái),如何將 AI 的能力從特定任務(wù)擴(kuò)展到更廣義的“智能”,是我們需要思考的問(wèn)題。
“我們非常擅長(zhǎng)通過(guò)訓(xùn)練算法來(lái)做特定的事情或玩特定的游戲,但我們?cè)趶V泛化應(yīng)用方面仍在嬰兒學(xué)步階段”他說(shuō)。“現(xiàn)在‘玩游戲’的人工智能和研究給人工智能界的回饋是,人類正在開發(fā)可被廣泛適用的方法,這些方法既是為玩游戲而開發(fā),也可以有其他用途”。
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。