2
本文作者: 思睿 | 2015-02-26 12:05 |
去年,Google斥資約4億美元投資了一家名不見(jiàn)經(jīng)傳的人工智能公司DeepMind。自那時(shí)起,DeepMind就開(kāi)始“閉門造車”,對(duì)外界透露的信息已經(jīng)相當(dāng)守口如瓶了。但這里有一件事是我們肯定知道的:Google利用人工智能公司DeepMind AI的研究成果,構(gòu)建了一套人工智能系統(tǒng),能夠?qū)W習(xí)并自主控制電子游戲,其不需要人指揮,接收簡(jiǎn)單指令后就可自主操作游戲。
根據(jù)今天在科學(xué)雜志《自然》上發(fā)表的新研究,Google的軟件確實(shí)做的不錯(cuò),在Atari 2600的一系列游戲的試玩中,Google AI在大多數(shù)時(shí)候的表現(xiàn)都非常接近人類的水平。
DeepMind軟件使用兩個(gè)AI技術(shù),一個(gè)叫深度學(xué)習(xí)(Deep learning); 另一個(gè)叫做深度強(qiáng)化學(xué)習(xí)(Deep reinforcement learning)。深度學(xué)習(xí)技術(shù)已廣泛應(yīng)用于Google內(nèi)部,以及諸如Facebook和微軟等公司中。該技術(shù)可幫助用于感知——幫助Android理解你所說(shuō)的內(nèi)容,而Facebook則知道你剛剛上傳的照片是誰(shuí)。但是直到現(xiàn)在,都沒(méi)有人像Google一樣合并了深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。
DeepMind的AI技術(shù)可讓其從環(huán)境中學(xué)習(xí),參照以前的處理方式并調(diào)整行為。與此前的人工智能系統(tǒng)相比,這是一次巨大飛躍。微軟、IBM、Clarifai、MetaMind開(kāi)發(fā)的主流圖像識(shí)別系統(tǒng)一般需要人類監(jiān)督,對(duì)圖片進(jìn)行注釋,才能學(xué)習(xí)如何識(shí)別。
通過(guò)合并這兩種技術(shù),Google建立了一個(gè)通用的學(xué)習(xí)算法,該算法可適用于許多其他的任務(wù)。所以此技術(shù)一旦足夠成熟,將會(huì)被Google用于其Google X實(shí)驗(yàn)室的其他項(xiàng)目以及自動(dòng)駕駛技術(shù)和機(jī)器人項(xiàng)目。
Google的人工智能研究人員Itamar Arel也向人們證實(shí)了,隨著該技術(shù)的不斷改善和提高他們也將會(huì)把這項(xiàng)技術(shù)運(yùn)用于Google的機(jī)器人。他認(rèn)為,DeepMind的技術(shù)在18至24個(gè)月的時(shí)間內(nèi)將可用于嘗試在真實(shí)世界的機(jī)器人上做出試驗(yàn)。
言歸正傳,Google的人工智能軟件在Atari 2600的測(cè)試中,在49個(gè)游戲中有29個(gè)游戲獲得了75%的專業(yè)測(cè)試的成績(jī)。
《自然》在文中并沒(méi)有介紹任何新的技術(shù)突破,但它表明,隨著DeepMind的技術(shù)更廣泛的應(yīng)用會(huì)發(fā)生什么。“我們將會(huì)利用更大的神經(jīng)網(wǎng)絡(luò),我們也會(huì)想出更好的訓(xùn)練制度?!?/span>
DeepMind創(chuàng)始人Demis Hassabis不會(huì)告訴我們Google除了嘗試在Atari游戲機(jī)上測(cè)試以外,是否還有測(cè)試其他的項(xiàng)目,但很明顯,Atari 2600的工作僅僅是他們的一個(gè)開(kāi)端。我們期待這項(xiàng)技術(shù)的后續(xù)研發(fā)進(jìn)展,也會(huì)持續(xù)關(guān)注這個(gè)項(xiàng)目。
via wired
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。