0
本文作者: Travis | 2014-12-25 17:35 |
在過去的幾十年時間,神經(jīng)科學(xué)家一直在嘗試設(shè)計一個能夠模擬人類大腦來識別物體,具有視覺技能的計算機(jī)網(wǎng)絡(luò)。正是因為人類大腦的識別物體的能力非常準(zhǔn)確和快速,很長的時間以來,人們都沒有設(shè)計出任何一個可以匹敵人類對視覺物體的識別能力的計算機(jī)模型。
但是,目前這個情況發(fā)生了一些改變。來自美國MIT的神經(jīng)科學(xué)家們進(jìn)行了一項最新的研究,他們發(fā)現(xiàn)了一種最新一代號稱“深層神經(jīng)網(wǎng)絡(luò)(deep neural networks)” 的東西,其能夠與靈長類動物大腦相匹敵。
MIT大腦與認(rèn)知科學(xué)學(xué)院院長,神經(jīng)科學(xué)教授James DiCarlo表示,由于這些神經(jīng)網(wǎng)絡(luò)是基于神經(jīng)科學(xué)家目前對大腦是如何進(jìn)行物體識別的理解,因此最新神經(jīng)網(wǎng)絡(luò)的發(fā)現(xiàn)則表明了神經(jīng)科學(xué)家對物體識別的基本原理有了較為精確的把握。他將這項研究發(fā)表在了12月18日出版的PLoS Computational Biology期刊上。
MIT麥克戈文大腦科學(xué)研究所的成員DiCarlo表示,“這一神經(jīng)網(wǎng)絡(luò)模型能夠在神經(jīng)總體空間里預(yù)測出神經(jīng)反應(yīng)和物體距離,這表明模型已經(jīng)集合了我們目前對大腦的最好理解?!?nbsp;
對靈長類動物的大腦是如何工作的進(jìn)一步了解,將促進(jìn)人類開發(fā)出更好的人工智能,甚至有朝一日這個技術(shù)可以成為修復(fù)視覺功能紊亂的新方法。
受大腦啟發(fā)
科學(xué)家們最早在上個世紀(jì)的70年代就已經(jīng)開始開發(fā)神經(jīng)網(wǎng)絡(luò)了,他們希望能夠模擬出大腦的能力來處理視覺信息、識別語音以及理解語言。
對于基于視覺的神經(jīng)網(wǎng)絡(luò),科學(xué)家們是受到了大腦視覺信息的層次表示(hierarchical representation)所啟發(fā)。隨著視覺從視網(wǎng)膜輸入,并進(jìn)入初級視皮層和顳下皮層(IT Cortex),輸入的視覺在每一個皮層上都會經(jīng)過處理,每處理一次就會變得更明確一些,直到物體最終被識別出來。
為了模擬這個過程,神經(jīng)網(wǎng)絡(luò)的設(shè)計師在計算機(jī)模型里創(chuàng)造了多個計算層。每一層執(zhí)行一個數(shù)學(xué)運(yùn)算,例如:線性標(biāo)量積。在每一個層面上,視覺物體的表現(xiàn)都變得越來越復(fù)雜,而無關(guān)緊要的信息則會被拋棄,例如:物體的位置或者移動。
每一個單獨(dú)的元素都是一個具有代表性的數(shù)學(xué)表達(dá)式,當(dāng)你將成百上千萬個這樣的數(shù)學(xué)表達(dá)式相結(jié)合后,就能實現(xiàn)將原始信號通過復(fù)雜的轉(zhuǎn)化變成非常適合物體識別的表達(dá)方式了。
在這項研究里,科研人員首次測量了大腦對物體識別能力。研究人員在顳下皮層和V4區(qū)植入了電極,這使得他們能夠觀察到動物看到每一個物體時所產(chǎn)生的神經(jīng)表現(xiàn)。
之后,研究人員將這些神經(jīng)表現(xiàn)與深層神經(jīng)網(wǎng)絡(luò)產(chǎn)生的神經(jīng)表現(xiàn)進(jìn)行對比,后者包含系統(tǒng)里每一個計算元素所產(chǎn)生的數(shù)字矩陣。每一張圖片都會產(chǎn)生不同的數(shù)字。
通過每一個這樣的計算變換,每一個網(wǎng)絡(luò)的層次,特定的物體或者圖片會逐漸接近,而其它物體會越來越遠(yuǎn)離。
更強(qiáng)大的處理能力
近期這種類型的神經(jīng)網(wǎng)絡(luò)之所以可以成功,取決于兩個重要因素。
一是計算機(jī)處理能力有了實質(zhì)性的飛躍。研究人員在物體時別上可以利用圖形處理單元(GPU),這是一種可以處理電子游戲中大量視覺內(nèi)容的高性能芯片。
第二個因素是研究人員現(xiàn)在能夠?qū)⒋罅繑?shù)據(jù)集輸入算法中,從而“訓(xùn)練”算法使之更加高效。這些數(shù)據(jù)集包含上百上千萬張圖片,每一張圖片都被人們從不同鑒別層面進(jìn)行了注解。例如:一張狗的圖片可能會被貼上動物、犬類、是否被馴養(yǎng)或者狗的品種等標(biāo)簽。
最初,神經(jīng)網(wǎng)絡(luò)并不擅長識別這些圖片,但是隨著它們“看”到的圖像越來越多,并在發(fā)現(xiàn)自己識別出錯后,會逐漸改進(jìn)它們的算法,直到最后能夠更加精確的識別物體。
via mit
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。