0
本文作者: nebula | 2023-05-29 14:22 |
在AI發(fā)展進(jìn)程中有一個(gè)非常有趣卻有違常識(shí)的現(xiàn)象,“一些對(duì)人類而言相對(duì)困難的任務(wù),例如下棋,對(duì) AI 來(lái)說(shuō)卻相對(duì)容易實(shí)現(xiàn);而在開放世界中與環(huán)境交互、進(jìn)行規(guī)劃和決策等對(duì)人類來(lái)說(shuō)較簡(jiǎn)單的事,AI 卻面臨巨大挑戰(zhàn)”,這就是莫拉維克悖論。
不過(guò),現(xiàn)在GITM 成功打破了這一悖論限制,在復(fù)雜且類似于現(xiàn)實(shí)世界的環(huán)境中取得突破,能夠像人類一樣生存,探索和創(chuàng)造了!
在緊密模擬真實(shí)世界的暢銷游戲《我的世界》(Minecraft) 中,由商湯科技聯(lián)合清華大學(xué)、上海人工智能實(shí)驗(yàn)室等機(jī)構(gòu)研究者們共同提出的通才 AI 智能體 Ghost in the Minecraft (GITM),不但能夠玩轉(zhuǎn)《我的世界》,且比以往所有智能體都有更加優(yōu)秀表現(xiàn)。
"Ghost in the Minecraft"(GITM)
像人類一樣生存,探索和創(chuàng)造
此研究在向通用人工智能(AGI)方向邁出了重要一步。
廣泛的任務(wù)覆蓋:GITM 在《我的世界》內(nèi)主世界的所有技術(shù)挑戰(zhàn)上實(shí)現(xiàn)了100%的任務(wù)覆蓋率(成功解鎖了完整的科技樹的262個(gè)物品),而此前所有智能體的總和只能覆蓋30%。(以往所有智能體方法包括OpenAI和DeepMind在內(nèi)總共只解鎖了78個(gè))
高任務(wù)成功率:在最受關(guān)注的 “獲取鉆石” 任務(wù)上,GITM取得了67.5%的成功率,相比于目前最佳成績(jī)(OpenAI VPT)提高了47.5%。
極高的訓(xùn)練效率:GITM的訓(xùn)練效率也達(dá)到新高度。環(huán)境交互步數(shù)只需已有方法的萬(wàn)分之一,單一CPU節(jié)點(diǎn)訓(xùn)練2天即可完成,遠(yuǎn)遠(yuǎn)低于之前OpenAI VPT所需的6480個(gè)GPU天或DeepMind DreamerV3所需的17個(gè)GPU天。
通才 AI 智能體 "Ghost in the Minecraft"(GITM)玩轉(zhuǎn)《我的世界》游戲,生存模式白手起家,拿到主世界的所有物品,挖鉆石不在話下,還能制作附魔書!
GITM 面對(duì)各類地形、環(huán)境、白天黑夜場(chǎng)景,甚至遇到怪物也能自如應(yīng)對(duì)
GITM還可以進(jìn)一步應(yīng)用在《我的世界》更加復(fù)雜的任務(wù)中,比如生存所需的避難所、農(nóng)田、鐵傀儡,創(chuàng)造自動(dòng)化設(shè)備所需的紅石電路、進(jìn)入下界所需的下界傳送門等。
這些任務(wù)展示了 GITM 強(qiáng)大的能力和可擴(kuò)展性,使得智能體能夠在《我的世界》中長(zhǎng)時(shí)間生存、發(fā)展,探索更加高級(jí)的世界。
通用人工智能突破加速AI產(chǎn)業(yè)化革命
研發(fā)攻克《我的世界》中所有技術(shù)挑戰(zhàn)的 AI 智能體GITM,目的是構(gòu)建一個(gè)具備自主學(xué)習(xí)和掌握整個(gè)真實(shí)世界技能的通用人工智能方向。
GITM打破了傳統(tǒng)以RL為基礎(chǔ)的架構(gòu),采用大型語(yǔ)言模型(LLM)作為智能體核心的新范式。
項(xiàng)目主頁(yè):https://github.com/OpenGVLab/GITM
這一創(chuàng)新也有助于推動(dòng)通用人工智能(AGI)的研究目標(biāo)加速實(shí)現(xiàn),發(fā)展出能夠在開放世界環(huán)境中像人一樣進(jìn)行感知、理解和交互的智能體,并為機(jī)器人和自動(dòng)駕駛等產(chǎn)業(yè)帶來(lái)巨大突破和進(jìn)步,有效解決現(xiàn)實(shí)世界中復(fù)雜環(huán)境和各類長(zhǎng)尾問(wèn)題,推動(dòng)AI技術(shù)更大規(guī)模的產(chǎn)業(yè)落地。
得益于“大模型+大算力”推進(jìn)AGI(通用人工智能)發(fā)展的戰(zhàn)略布局,以及全棧大模型研發(fā)體系,商湯科技得以在多模態(tài)、多任務(wù)通用大模型領(lǐng)域快速發(fā)展,以“日日新SenseNova”大模型體系為核心,不斷助力創(chuàng)新技術(shù)快速應(yīng)用于智能汽車、智慧生活、智慧商業(yè)和智慧城市等領(lǐng)域,持續(xù)提升產(chǎn)業(yè)智能化滲透率。
同時(shí),商湯也積極從產(chǎn)業(yè)應(yīng)用中不斷積累Know-How,如早在2016年就開始布局智能汽車領(lǐng)域,并不斷探索和解決自動(dòng)駕駛應(yīng)用中大量的規(guī)劃和決策問(wèn)題。2022年中,商湯基于OpenDILab決策AI平臺(tái)開發(fā)的AI模型DI-star在《星際爭(zhēng)霸》中戰(zhàn)勝了曾經(jīng)的大中華區(qū)冠軍,展示出強(qiáng)大的決策AI能力,有效推動(dòng)自動(dòng)駕駛打破規(guī)則限制,實(shí)現(xiàn)更高效的規(guī)劃控制。今天,GITM的成功將推動(dòng)自動(dòng)駕駛等應(yīng)用處理復(fù)雜任務(wù)的能力更上一層樓,打破更高的技術(shù)天花板。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。