2
本文作者: 劉子榆 | 2016-10-13 17:18 |
還記得擊敗世界圍棋大師的阿爾法狗 AlphaGo 嗎?
它來自谷歌 DeepMind 團隊,現(xiàn)在這個人工智能實驗室又推出了一項重磅研究——可微分神經(jīng)計算機的神經(jīng)網(wǎng)絡(luò)模型(Differentiable Neural Computer,簡稱 DNC)。這種新型模型將神經(jīng)網(wǎng)絡(luò)與可讀寫的外部存儲器結(jié)合,既能像神經(jīng)網(wǎng)絡(luò)那樣通過試錯和樣本訓練進行深度學習,又能像傳統(tǒng)計算機一樣處理數(shù)據(jù)。
深度學習作為一種神經(jīng)網(wǎng)絡(luò)人工智能算法,能夠通過一些“深”層計算,對海量的數(shù)據(jù)進行更新學習。這種類似大腦結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)層由節(jié)點組成(也被稱為神經(jīng)元)。許多科技巨頭如谷歌、Facebook、亞馬遜和微軟都一直在訓練神經(jīng)網(wǎng)絡(luò)來學習如何更好地處理工作任務(wù),包括識別狗的圖像以及做出更好的翻譯軟件。這些 AI 功能已經(jīng)讓數(shù)百萬人在使用谷歌翻譯等在線服務(wù)中受益。
但是,神經(jīng)網(wǎng)絡(luò)面臨著巨大的挑戰(zhàn):常規(guī)計算機可以處理復雜形式的數(shù)據(jù),但是需要手動編程來執(zhí)行這些任務(wù)。雖然人工神經(jīng)網(wǎng)絡(luò)可以像大腦一樣進行學習,從數(shù)據(jù)中識別模式,但是它缺少存儲器架構(gòu),無法對結(jié)構(gòu)化數(shù)據(jù)進行符號處理。
DNC 簡易模型,圖源:FT
為了提高深度學習的能力,谷歌的 DeepMind 團隊創(chuàng)造了這種新型機器學習算法“ 可微分神經(jīng)計算機”DNC,它將“神經(jīng)網(wǎng)絡(luò)”計算系統(tǒng)與傳統(tǒng)計算機存儲器結(jié)合在一起。
神經(jīng)網(wǎng)絡(luò)是一個互聯(lián)的系統(tǒng),它模仿生物神經(jīng)網(wǎng)絡(luò)運行,比如大腦的工作模式。在最近取得的各項人工智能成就中,神經(jīng)網(wǎng)絡(luò)扮演了關(guān)鍵角色。例如,在數(shù)字助手,如 Google Voice、Siri 中增強語音識別能力。在之前的研究中,神經(jīng)網(wǎng)絡(luò)只能連接自有網(wǎng)絡(luò)所包含的數(shù)據(jù)。而最近,DeepMind 團隊宣布,在 DNC 的支持下,神經(jīng)網(wǎng)絡(luò)可以接入之前不相容的外部數(shù)據(jù),比如以傳統(tǒng)數(shù)字模式編碼的文本。這也就是說,我們離會思考的計算機更近了一步。
從數(shù)學上講,DNC 類似一個可微分的函數(shù),這或許是研究人員稱它為可微分的原因。而數(shù)字計算機不可微分,因此也無法做到像神經(jīng)網(wǎng)絡(luò)一樣從數(shù)據(jù)中學習。DNC 可以成功地理解圖形結(jié)構(gòu),如家譜或傳輸網(wǎng)絡(luò),它甚至可以根據(jù)一張家譜來判斷一個人的家族關(guān)系。此外,DNC 還能在沒有先驗知識的情況下規(guī)劃在倫敦地鐵上的最佳路線,解決涉及用符號語言描述目標的移動拼圖謎題。
美國HBO連續(xù)劇《西部世界》劇照
推理是靈長類動物才具備的能力,DeepMind 這種或許能夠“喚醒”機器的人工智能算法與最近大火的神劇《西部世界》中的設(shè)想一致——也許有一天,我們真的能看到會自主推理的機器人,以及能思考的計算機。
DNC 包含了若干個模塊,所有的這些模塊都完全不是符號化的,彼此之間通過純粹的模擬激活模型來交換信息流(streams),正如從生物大腦中記錄的那樣。
推理的一個關(guān)鍵前提,是記憶。在計算機中,記憶的角色由隨機訪問內(nèi)存 RAM 承擔。當計算機進行推理,也就是運行程序時,所有的信息都被捆綁在工作的內(nèi)存中,并且結(jié)合的方式數(shù)不勝數(shù)。把人類的推理過程拿來與計算機程序相比,其實并不牽強。事實上,在現(xiàn)代可編程計算機(圖靈機)和亞里士多德的三段論存在嚴肅的歷史聯(lián)系。
DNC 項目主管 Alex Graves 表示,“神經(jīng)網(wǎng)絡(luò)的記憶受到計算本身的約束,我們決定通過分離存儲器的方式讓它變得更強大,這樣一來,不影響處理器就可以擴充規(guī)模?!?/span>
一些獨立計算機科學家認為通用 DNC 應(yīng)用范圍廣闊,例如,它可以用來生成視頻注釋,從文本中提取有意義的內(nèi)容。甚至在未來,它還能夠應(yīng)用在包含問答、像真實世界一樣的對話,這種需要一定的推理能力任務(wù)。
這個新項目被 Google 發(fā)表在《自然》雜志上。在文章里 Google 舉了若干個應(yīng)用實例,比如,集成后的深度學習技術(shù)能夠自動發(fā)現(xiàn)兩個地鐵站之間最短的路線,它會自己進行“推理”,說出你想要到達的目的地。正確率高達 90% 以上。
英國《金融時報》援引斯坦福大學心智、大腦和計算中心主任 Jay McClelland 稱,這項研究將成為人工智能領(lǐng)域“有趣且重要的里程碑”。
Via financial times & spectrum.ieee
推薦閱讀:
淺談神經(jīng)網(wǎng)絡(luò)訓練方法,Deepmind更青睞正向傳播
DeepMind發(fā)布最新原始音頻波形深度生成模型WaveNet,將為TTS帶來無數(shù)可能
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。