1
雷鋒網(wǎng)按:本文作者癡笑,矽說(微信號(hào):silicon_talks)主筆。
你信不信有一天,硅工造的芯片會(huì)寫詩?
如果信,
那說好的“詩三百,一言以蔽之,思無邪”,
還真的是“無邪”么?
如果不信,請(qǐng)讀下面這一首:
如果要給這詩一個(gè)賞析,大概可以是一個(gè)憂傷的故事。
天邊云的變換復(fù)雜,而我卻是半夢半醒,我在想一個(gè)人,想第一次和他相見,想他的風(fēng)流倜儻,想他的英雄颯爽。
如果你是個(gè)文科生,或許你會(huì)嘲笑這首連平仄都不滿足的劣質(zhì)詩歌,韻腳也押的有些蹩腳,故事更是為賦新詞強(qiáng)說愁。
如果你是理科男,或許對(duì)這種思春的小情懷不以為然。
不過,那是因?yàn)槟銈儾]有看懂這首詩。
因?yàn)檫@詩暗藏了一個(gè)密碼,藏著人工智能遇到摩爾定律后蹭出的火花。
另外,這詩不是人工智能的產(chǎn)物,只是矽說在這個(gè)人工智能橫行的年代里特有的小情懷。
但可能在不遠(yuǎn)的將來,人工智能將會(huì)開車,會(huì)翻譯,會(huì)調(diào)情,也會(huì)寫下更美的篇章。想解開這個(gè)人工智能與集成電路的秘密?關(guān)注雷鋒網(wǎng)后期更新,我們一句一句地讀下去。
〈一〉昨夜神風(fēng)送層云
在我讀書的時(shí)候,人工智能(Artifical Intelligence, AI)從來就是CS (Computer Science)的天下,哪有電路攛掇的份。那時(shí)候的碼農(nóng)們或許會(huì)掛著機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘,支持向量機(jī),壓縮感知……但從來沒有一次,電路的突破是由人工智能推動(dòng)的??墒窃诮裉?,如果你打開半導(dǎo)體行業(yè)的利好消息,有多少不是和人工智能,深度學(xué)習(xí)相關(guān)的?
過去幾個(gè)月,光在半導(dǎo)體巨頭們發(fā)生的人工智能的故事就足以吊足大家的胃口。何況,這還是只是很多硅工心目中的人工智能元年。
是什么導(dǎo)致了半導(dǎo)體行業(yè)”AI一出驚天下“的巨大改變?矽說推出“腦芯編”系列,為你揭秘類腦芯片的過去,現(xiàn)在與未來。
從人工智能到神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)
在人工智能改變半導(dǎo)體行業(yè)之前,在AI領(lǐng)域發(fā)生過一場“華山論劍”,耗時(shí)數(shù)載,最終以“深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)(Deep Learning Neural Network)”一統(tǒng)江湖落下帷幕。該過程腥風(fēng)血雨,而主角“神經(jīng)網(wǎng)絡(luò)”的遭遇更堪比張無忌、楊過,歷經(jīng)少年時(shí)的悲慘遭遇,被無數(shù)號(hào)稱時(shí)代“大俠”嗤之以鼻,但終究是主角光環(huán)加持,加之得外家指點(diǎn),十年一劍終成大器,號(hào)令天下,誰敢不從。
本篇對(duì)這里其中的故事,按下不表,有好事者,可以去各處搜搜,劇情精彩不容錯(cuò)過。但是這里還是要感謝,在神經(jīng)網(wǎng)絡(luò)經(jīng)歷最寒冬的時(shí)候,一眾大牛如 Yann LeCun (讀作楊雷昆,不是嚴(yán)立春?。?,Geoffrey Hinton等的默默堅(jiān)守,才有神經(jīng)網(wǎng)絡(luò)的今天。不過他們也早已是Facebook / Google的首席科學(xué)家,如今功成名就,也是吾等小輩無法企及的高度。
Yann LeCun, Geoffrey Hinton
神經(jīng)網(wǎng)絡(luò)在人工智能領(lǐng)域,屬于機(jī)器學(xué)習(xí)一路的分支。所謂機(jī)器學(xué)習(xí),就是讓電腦經(jīng)過學(xué)習(xí)后代替人腦做出判斷,理解,甚至決定(還記得贏了李世石的AlphaGo么?)。而所謂深度學(xué)習(xí)和淺學(xué)習(xí)的區(qū)別在于設(shè)計(jì)者是否告訴電腦的學(xué)習(xí)策略。最常見的例子是大家電子郵件系統(tǒng)里的垃圾郵件分類,一般一份郵件是否是垃圾郵件,在于它是否滿足一些標(biāo)準(zhǔn),比如是不是群發(fā)的,有沒有叫你買東西的廣告,是不是圖片占有比例很高,然后發(fā)信人有沒有被舉報(bào)過等等……這些標(biāo)準(zhǔn)都是一個(gè)個(gè)特征,如果一種機(jī)器學(xué)習(xí)方法規(guī)定了學(xué)習(xí)的特征與策略,那就是淺學(xué)習(xí),如果沒有規(guī)定,需要算法本身去挖掘策略,那就是深度學(xué)習(xí)。
所以,深度學(xué)習(xí)的一大隱憂就是——人類并不知道算法本身究竟在想什么?所以如果哪天他在他負(fù)責(zé)的算法下隱藏了一個(gè)暗算/統(tǒng)治人類的bug,那我們就被徹底奴役了。
不過,所謂“莊生曉夢迷蝴蝶”,人類自己究竟是不是被另外一個(gè)物種開發(fā)出來的一種新智慧呢?然后,那個(gè)物種是不是已經(jīng)被我們滅絕了呢?我們并沒有答案。
碼農(nóng)老師教的生物課
為了弄清這橫掃千軍的神經(jīng)網(wǎng)絡(luò),首先讓我們來上一堂不污的生物課。既然叫神經(jīng)網(wǎng)絡(luò),那起源就是生物腦科學(xué)。很久以前,人們發(fā)現(xiàn)一個(gè)單神經(jīng)細(xì)胞(也叫神經(jīng)元)包括輸入(樹突dendrites),激活判斷(細(xì)胞核nucleus),輸出(軸突axon)和與下一個(gè)神經(jīng)元的連接關(guān)系(突觸synapse)。如果用數(shù)學(xué)抽象出來過程,就是把一堆輸入經(jīng)過線性組合以后經(jīng)過一個(gè)閾值判斷,然后輸出給下一級(jí)。這樣一個(gè)簡單的神經(jīng)元就形成。把足夠多個(gè)神經(jīng)元連起來就能實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)了。
上面兩個(gè)圖就是真實(shí)的神經(jīng)元和它的數(shù)學(xué)模型。不過我還是要吐槽下:
從上述神經(jīng)元的提出,到許多仿生的算法結(jié)構(gòu)的研究,如多層感知器(Multilayer Perceptron) ,脈沖神經(jīng)元(Spiking Neural)之類的,經(jīng)過了一個(gè)甲子的時(shí)間,特別但都沒沒什么巨大的成功,原因有兩個(gè):
(1)當(dāng)時(shí)的集成電路計(jì)算規(guī)模與資源遠(yuǎn)沒有達(dá)到面向?qū)嶋H應(yīng)用的需求,仔細(xì)去研究神經(jīng)元的數(shù)學(xué)模型,會(huì)發(fā)現(xiàn)每個(gè)神經(jīng)元有若干個(gè)權(quán)重和成累加計(jì)算 。他對(duì)應(yīng)匯編可以大致是如下流程:
累加器清零 (mov)
-- 循環(huán)開始 (branch)
從存儲(chǔ)器中加載權(quán)重 (load)
從存儲(chǔ)器/外設(shè)中加載輸入 (load)
權(quán)重 乘以 輸入 (multiply)
累加 (add)
-- 判斷是否重新循環(huán) (goto)
激活函數(shù) (??)
輸出 存儲(chǔ) (store)
對(duì)于一個(gè)N輸入的神經(jīng)元要走N個(gè)循環(huán),這對(duì)于上個(gè)世紀(jì)的單核單線程的CPU,實(shí)在是操作難度太復(fù)雜。這也就是為什么當(dāng)流水線與并行處理 不斷壯大的近十年,神經(jīng)網(wǎng)絡(luò)的發(fā)展得到了迅猛發(fā)展。
(2)連得不對(duì)。這短短四個(gè)字,雖說的輕巧,但要找到連連看的竅門,著實(shí)花費(fèi)了多少人的青春?關(guān)于怎么連,各位看官先別著急,且聽腦芯編下回分解。
作為腦芯編的開篇,今天就到這里,所謂“神風(fēng)送層云”指的就是集成電路的下一個(gè)增長點(diǎn)或許就在在人工智能領(lǐng)域取得巨大成功的神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)上。
特別鳴謝復(fù)旦大學(xué)腦芯片研究中心提供技術(shù)咨詢,歡迎有志青年報(bào)考。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。