3
本文作者: 奕欣 | 2017-02-28 10:21 |
雷鋒網(wǎng) AI 科技評(píng)論按:自去年 3 月 AlphaGo 戰(zhàn)勝李世乭后,人工智能「突如一夜春風(fēng)來(lái)」地步入人們視線,業(yè)已成為家喻戶(hù)曉的一個(gè)名詞。目前,以深度卷積神經(jīng)網(wǎng)絡(luò)為核心,以計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別與自然語(yǔ)言處理為代表的人工智能產(chǎn)品已經(jīng)步入全面開(kāi)發(fā)與大規(guī)模產(chǎn)業(yè)化應(yīng)用階段。這一趨勢(shì)實(shí)際上與人類(lèi)的視聽(tīng)覺(jué)感知能力息息相關(guān),但不少初涉這一領(lǐng)域的從業(yè)者或是對(duì)此感興趣的學(xué)生們卻依然是霧里看花,原因不外有二,一是在學(xué)習(xí)理論的過(guò)程中,自學(xué)往往缺乏系統(tǒng)的歸納和整理;二是教科書(shū)跟不上產(chǎn)業(yè)界的技術(shù)變化,而網(wǎng)上信息良莠不齊,自學(xué)者也缺少及時(shí)且實(shí)用的教程。
為了推動(dòng) AI 人才全面化,AI 科技評(píng)論將為大家提供一個(gè)業(yè)界頂級(jí)的專(zhuān)業(yè) AI 技術(shù)培訓(xùn)平臺(tái):1024MOOC,作為長(zhǎng)期站在研究第一線的學(xué)者,清華大學(xué)計(jì)算機(jī)系教授、博士生導(dǎo)師鄧志東也見(jiàn)證了近年來(lái)人工智能從冷門(mén)到大火的歷程。
在雷鋒網(wǎng) AI 科技評(píng)論的邀請(qǐng)下,本周末(3 月 4 日),鄧教授將于 1024MOOC 平臺(tái)開(kāi)展長(zhǎng)達(dá) 20 小時(shí)、持續(xù)兩個(gè)周末的「人工智能之神經(jīng)網(wǎng)絡(luò)特訓(xùn)班」課程,系統(tǒng)地為報(bào)名課程的同學(xué)們介紹人工智能中的神經(jīng)網(wǎng)絡(luò),特別是深度學(xué)習(xí)的發(fā)展現(xiàn)狀、基本原理和主要方法,并結(jié)合具體應(yīng)用案例,進(jìn)行編程實(shí)操剖析。課程將強(qiáng)調(diào)各種理論方法在解決實(shí)際問(wèn)題中的綜合應(yīng)用,也將補(bǔ)充介紹最新的科研成果與前沿領(lǐng)域,可點(diǎn)擊此處了解報(bào)名詳情。
目前我們所了解的人工智能,最起初是 1956 年 McCarthy、Minsky、Shannon 和 Rochester 等在 Dartmouth 學(xué)院發(fā)起的夏季研討會(huì)上提出的概念,人工智能被界定為「研究與設(shè)計(jì)智能體」的工作,而其中智能體的定義就是「能夠感知環(huán)境,并采取行動(dòng)使成功機(jī)會(huì)最大化的系統(tǒng)。」
人工神經(jīng)網(wǎng)絡(luò)最開(kāi)始是基于 MP 人工神經(jīng)元模型和 Rosenbaltt 的感知機(jī)發(fā)展起來(lái)的。而現(xiàn)在非常流行的深度卷積神經(jīng)網(wǎng)絡(luò)則經(jīng)由 1974-82 年日本學(xué)者 Fukushima 提出的認(rèn)知機(jī) (cognitron) 和神經(jīng)認(rèn)知機(jī) (neocognitron) 模型演化而成,它的原理正是模擬人的視覺(jué)皮層通路而構(gòu)造的。如果要將深度神經(jīng)網(wǎng)絡(luò)與人腦生理構(gòu)造做類(lèi)比,鄧教授認(rèn)為這就相當(dāng)于飛機(jī)與鳥(niǎo)的關(guān)系?!革w機(jī)并沒(méi)有像鳥(niǎo)一樣有兩個(gè)撲翼式翅膀,用純生物的內(nèi)部機(jī)理去模仿,這樣的飛機(jī)肯定是沒(méi)有多大實(shí)用價(jià)值的。我們現(xiàn)在設(shè)計(jì)的飛機(jī),利用的是空氣動(dòng)力學(xué)、引擎和固定機(jī)翼等,但人造的飛機(jī)不論是飛行的續(xù)航里程、高度或是載客量,都要遠(yuǎn)遠(yuǎn)超過(guò)生物鳥(niǎo)?!?/p>
因此,如果現(xiàn)代腦科學(xué)或是神經(jīng)生物學(xué)領(lǐng)域有任何的進(jìn)步,對(duì)人類(lèi)在深度神經(jīng)網(wǎng)絡(luò)的研究與探索,都會(huì)有很大的啟發(fā),也是極其重要的創(chuàng)新源泉。而自然地,由于人類(lèi)最重要的兩個(gè)感官就是視覺(jué)和聽(tīng)覺(jué),因此計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別與自然語(yǔ)言處理就成為了目前應(yīng)用領(lǐng)域最廣,發(fā)展最快的三個(gè)分支。
包括人臉識(shí)別、視覺(jué)物體識(shí)別、交通標(biāo)志識(shí)別在內(nèi)的計(jì)算機(jī)視覺(jué)特定應(yīng)用場(chǎng)景,其識(shí)別性能目前已經(jīng)達(dá)到了人類(lèi)水平,基于深度學(xué)習(xí)的語(yǔ)音識(shí)別、自然語(yǔ)言處理的性能也比傳統(tǒng)方法好了很多。而這些在鄧教授看來(lái)也是此類(lèi)弱人工智能技術(shù)能迅速受到產(chǎn)業(yè)界關(guān)注的根本原因。技術(shù)的進(jìn)步同樣會(huì)催生應(yīng)用開(kāi)發(fā)的商業(yè)落地,因此與人類(lèi)水平的性能比較距離自然就成為了分水嶺。「以往的人工神經(jīng)網(wǎng)絡(luò)性能與人類(lèi)相比還是差得太遠(yuǎn),產(chǎn)業(yè)界鮮有人關(guān)注,也沒(méi)有什么商業(yè)價(jià)值?!?/p>
而語(yǔ)音識(shí)別及機(jī)器翻譯等方面的內(nèi)容,雖然還沒(méi)有達(dá)到人類(lèi)水平,但相比之前也已經(jīng)有了很大的技術(shù)突破。目前,文本分類(lèi)利用深度神經(jīng)網(wǎng)絡(luò),其研究的門(mén)檻也已經(jīng)降低了不少,系統(tǒng)可以通過(guò)深度監(jiān)督學(xué)習(xí)獲取文本與類(lèi)別的映射關(guān)系,識(shí)別正確率也已經(jīng)有了很大的提升,超過(guò)了傳統(tǒng)的 n-gram 方法。
但在鄧教授看來(lái),這方面神經(jīng)網(wǎng)絡(luò)識(shí)別能力尚未達(dá)到人類(lèi)水平的根本原因在于,神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)義還不能實(shí)現(xiàn)理解。
「一個(gè)正常人一睜開(kāi)眼睛,在無(wú)意識(shí)的過(guò)程中就能夠?qū)⒁磺形矬w進(jìn)行分類(lèi)或已有了真實(shí)物體對(duì)應(yīng)的概念,之后就可利用已存儲(chǔ)在頭腦中的常識(shí)了。我們都知道杯子一定要放在桌子上,而不可能反過(guò)來(lái),這種概念之間的相互關(guān)系實(shí)際上就是人類(lèi)的常識(shí)。原來(lái)的符號(hào)主義走了很長(zhǎng)時(shí)間也無(wú)法進(jìn)行下去,而我們也不能再走老路。從深度卷積神經(jīng)網(wǎng)絡(luò)獲得分層特征的表達(dá)學(xué)習(xí),從概念到知識(shí),再到更高層次的概念和知識(shí),如此形成不同粒度的知識(shí)圖譜,這樣才有可能實(shí)現(xiàn)人類(lèi)在人工智能上的突破?!挂虼肃嚱淌趶?qiáng)調(diào),人工智能研究的關(guān)鍵在于一定要建立在已有的感知智能的成果基礎(chǔ)之上。
在理論層面的前沿探索上,以無(wú)監(jiān)督或半監(jiān)督學(xué)習(xí)為研究導(dǎo)向的生成式對(duì)抗網(wǎng)絡(luò)(GAN),帶注意力(attention)、記憶(memory)和捷徑 (shortcut) 的 LSTM 等,都是目前進(jìn)展比較快的一些研究。而為了發(fā)展通用人工智能與實(shí)現(xiàn)語(yǔ)義理解,鄧教授認(rèn)為需要結(jié)合自上而下的知識(shí)驅(qū)動(dòng)與自下而上的數(shù)據(jù)驅(qū)動(dòng),以便利用小樣本也能完成深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。
隨著學(xué)術(shù)界頻傳佳音,產(chǎn)業(yè)界自然也在尋求著變化。鄧教授認(rèn)為,要實(shí)現(xiàn)產(chǎn)業(yè)化最重要的是選擇一個(gè)落地的垂直細(xì)分領(lǐng)域,以適應(yīng)帶標(biāo)簽大數(shù)據(jù)的獲取。而很明顯,高校比起市場(chǎng)嗅覺(jué)靈敏的企業(yè)來(lái)說(shuō)并不擅長(zhǎng)這樣的工作。高校主要專(zhuān)于前沿交叉技術(shù)的研究與探索,對(duì)行業(yè)情況與用戶(hù)需求則缺乏深透的了解。但對(duì)產(chǎn)業(yè)界而言,人工智能技術(shù)在行業(yè)應(yīng)用時(shí)一定要選擇好特定的應(yīng)用場(chǎng)景,算法則反而不是最重要的。
這是一個(gè)新興領(lǐng)域的產(chǎn)業(yè)鏈,而企業(yè)在大數(shù)據(jù)來(lái)源和計(jì)算平臺(tái)資源兩個(gè)方面都完全碾壓高校。
高校研究通常采用的是像 ImageNet 這樣的公開(kāi)數(shù)據(jù)集,主要目的是為了對(duì)算法進(jìn)行性能測(cè)試,自然也沒(méi)有什么商業(yè)價(jià)值。而企業(yè)并不會(huì)對(duì)外公開(kāi)與公司利益相關(guān)的數(shù)據(jù),除非合作,高校自然也拿不到手。
而在計(jì)算資源上,一塊 K80 的 GPU 可能就是四到五萬(wàn)元,而百度這樣的企業(yè)可能會(huì)買(mǎi) 2000 塊來(lái)搭建超大型集群服務(wù)器,大概就是 8000 萬(wàn)到 1 個(gè)億的價(jià)格。而 GPU 跑起來(lái)功耗特別大,可能高校連付電費(fèi)都會(huì)覺(jué)得很吃力。
「高校的優(yōu)勢(shì)其實(shí)在于能夠看得更長(zhǎng)遠(yuǎn),在國(guó)家的支持下可以做更長(zhǎng)遠(yuǎn)的前沿研究與布局。我們一直認(rèn)為,如果某領(lǐng)域企業(yè)開(kāi)始強(qiáng)力介入了,高校最好就放棄吧,應(yīng)該去做一些企業(yè)目前不太關(guān)注的,更具前瞻性的研究,比如量子計(jì)算,甚至是自主飛行的機(jī)器人。我自己感到的是一種強(qiáng)烈的危機(jī)感:全世界的頂級(jí)跨國(guó)企業(yè)都進(jìn)入人工智能領(lǐng)域來(lái)了,其實(shí)國(guó)內(nèi)高校并沒(méi)有什么優(yōu)勢(shì)。我認(rèn)為,除非高校自己在體制機(jī)制上有了更大的創(chuàng)新(比如通過(guò)建立國(guó)家實(shí)驗(yàn)室),否則與谷歌、Facebook 等跨國(guó)企業(yè)的差距會(huì)越來(lái)越大。如果能有類(lèi)似谷歌、 Facebook 這樣量級(jí)的大公司牽頭中國(guó)人工智能的發(fā)展,我覺(jué)得中國(guó)的人工智能才能看到引領(lǐng)世界的明天?!?/p>
這種境況也催生了學(xué)術(shù)圈的兩種主流去向:一種是直接跨入產(chǎn)業(yè)界,如多在互聯(lián)網(wǎng)公司研究院同時(shí)涉足產(chǎn)業(yè)與學(xué)術(shù)研究,以 NYU 大學(xué)教授 Yann LeCun 加入 Facebook 為代表;另一種則是學(xué)術(shù)界,產(chǎn)業(yè)界雙棲的代表,比如山世光去年創(chuàng)辦中科視拓。在鄧教授的想法中,他個(gè)人比較看好第一條道路,畢竟注意力的集中有利于研究的專(zhuān)注性?!改阆胧裁炊嫉玫降脑?huà),實(shí)際上可能什么都得不到。」
但他也指出,目前包括谷歌、Facebook、微軟及百度等在內(nèi)的一些跨國(guó)企業(yè)同樣提供了非常良好的學(xué)術(shù)研究環(huán)境,早已成為國(guó)際頂級(jí)人工智能會(huì)議的主角,這可以算得上是產(chǎn)業(yè)界通過(guò)學(xué)術(shù)研究回報(bào)與影響世界的典范。國(guó)內(nèi)企業(yè)的優(yōu)勢(shì)在于更大規(guī)模的應(yīng)用場(chǎng)景和可能擁有的大數(shù)據(jù),特別是目前商業(yè)模式的創(chuàng)新與落地速度很快,再加上政府的支持力度很大。但人工智能原創(chuàng)性的算法在國(guó)內(nèi)一向非常鮮見(jiàn),按鄧教授的理解,現(xiàn)在國(guó)內(nèi)大部分的學(xué)術(shù)研究都熱衷于對(duì)原創(chuàng)模型進(jìn)行修修補(bǔ)補(bǔ),「刷紀(jì)錄」或稱(chēng)「刷數(shù)據(jù)」。目前的研究氛圍總體上還是比較急功近利和浮躁,缺少大的理論與方法創(chuàng)新。
現(xiàn)在人工智能雖然很火,但還是處于剛剛起步的階段,有很多問(wèn)題需要解決。但學(xué)生是否愿意耐得住寂寞坐冷板凳,即使在幾年內(nèi)沒(méi)有研究成果還會(huì)堅(jiān)持下去?鄧?yán)蠋熣J(rèn)為,最重要的還是學(xué)生的興趣?!缚茖W(xué)研究本身就是一種興趣,所以同學(xué)們?nèi)绻娴膶?duì)人工智能感興趣,那么可能真的是廢寢忘食,而不是別人拿錢(qián)催著你走?!怪劣趯?duì)做研究的同學(xué)有何建議,鄧?yán)蠋熡X(jué)得可以盡早跟著老師去做一些科研類(lèi)的項(xiàng)目,「站在前行者的肩膀上」,趁著年輕多出創(chuàng)新性強(qiáng)的論文。
但對(duì)于你我這樣的普通人而言,需要怎樣擁抱變化?「我們生活在三元空間里,一個(gè)是物理空間,一個(gè)是信息空間,再一個(gè)是人類(lèi)社會(huì)。天天涌現(xiàn)那么大的數(shù)據(jù)量,肯定是要進(jìn)行數(shù)據(jù)自動(dòng)化的,而目前剛好出現(xiàn)了(弱)人工智能技術(shù)對(duì)它的支撐。人類(lèi)文明不斷進(jìn)步,很大程度上也是因?yàn)榄h(huán)境發(fā)生了變化。人類(lèi)已具有自動(dòng)適應(yīng)環(huán)境變化的能力。人工智能的進(jìn)一步發(fā)展勢(shì)必優(yōu)化、補(bǔ)充和取代許多僅需簡(jiǎn)單腦力勞動(dòng)的職業(yè),但一定會(huì)產(chǎn)生新的工種出來(lái)。馬車(chē)時(shí)代對(duì)汽車(chē)問(wèn)世的擔(dān)憂(yōu),沒(méi)有必要,同時(shí)也不以人的意志為轉(zhuǎn)移,那我們就順勢(shì)而為吧。」
而如果你不想被動(dòng)地接受這樣的變化,想在人工智能浪潮里有所作為的話(huà),一起和雷鋒網(wǎng)從鄧教授本周末開(kāi)始的深度神經(jīng)網(wǎng)絡(luò)課程開(kāi)始學(xué)習(xí),或許是一個(gè)不錯(cuò)的選擇。
卷積神經(jīng)網(wǎng)絡(luò)早在1975年就被提出,而在1995年被正式命名,又在2012年因Hinton團(tuán)隊(duì)ImageNet大賽奪冠而聞名,2016年的阿爾法狗更是將人工智能推上了高潮。鄧志東教授從事包括深度神經(jīng)網(wǎng)絡(luò)在內(nèi)的人工神經(jīng)網(wǎng)絡(luò)研究25年,在清華授課20余年,他在一線教育上感受到的人工智能發(fā)展比我們更加洶涌。
在本次課程中,除了基礎(chǔ)課程理論:生物神經(jīng)系統(tǒng),人工神經(jīng)元模型,BP網(wǎng)絡(luò),Hopfield網(wǎng)絡(luò),更為寶貴的是,你還將聆聽(tīng)鄧教授25年專(zhuān)研背后所經(jīng)歷的AI洪流和他自身的經(jīng)驗(yàn)分享,教你讀懂人工智能發(fā)展歷史,教你如何上手編程實(shí)操,教你避開(kāi)哪些AI的坑。如果你足夠勤奮,你還能聽(tīng)到深度卷積神經(jīng)網(wǎng)絡(luò)如何在無(wú)人駕駛領(lǐng)域應(yīng)用。鄧教授做了8年無(wú)人駕駛研究,難道我會(huì)告訴你?
如果你對(duì)人工智能有興趣想轉(zhuǎn)型,如果你有一定的數(shù)學(xué)和編程基礎(chǔ),或者對(duì)自身的學(xué)習(xí)能力有信心但需要一個(gè)引領(lǐng)入門(mén)神經(jīng)網(wǎng)絡(luò)的導(dǎo)師,又或是想一窺人工智能究竟如何落地的?歡迎來(lái)報(bào)名。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。