0
本文作者: 程弢 | 2016-12-17 23:00 | 專(zhuān)題:2016中國(guó)人工智能產(chǎn)業(yè)大會(huì) |
雷鋒網(wǎng)按:今日,由中國(guó)人工智能學(xué)會(huì)主辦的 2016 中國(guó)人工智能產(chǎn)業(yè)大會(huì)暨第六屆吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)?lì)C獎(jiǎng)盛典在深圳舉行。英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)站在芯片供應(yīng)商的角度為大家分享了他對(duì)人工智能的觀點(diǎn)。以下整理自演講內(nèi)容,雷鋒網(wǎng)做了不改變?cè)獾男薷摹?/em>
據(jù)第三方機(jī)構(gòu)預(yù)測(cè),到2020年會(huì)有500億的智能設(shè)備連入互聯(lián)網(wǎng),這些智能設(shè)備會(huì)產(chǎn)生大量的數(shù)據(jù),到2020年,僅一位互聯(lián)網(wǎng)用戶每日就能產(chǎn)生1.5GB的流量,而一家智慧工廠每天產(chǎn)生的數(shù)據(jù)更是高達(dá)1000000GB,當(dāng)然,你完全不用為此感到驚慌,這些數(shù)據(jù)正是人工智能算法的基礎(chǔ)。
這些數(shù)據(jù)促使了我們有更好的數(shù)據(jù)去訓(xùn)練人工智能的算法,同時(shí)這些數(shù)據(jù)也可以讓我們通過(guò)訓(xùn)練好的人工智能算法,產(chǎn)生更大的增值價(jià)值,這也是為什么人工智能吸引了這么多的科研人員和企業(yè),大家一起把資源貢獻(xiàn)出來(lái)。
宋繼強(qiáng)如是說(shuō)。
數(shù)據(jù)是基礎(chǔ),但擁有數(shù)據(jù)之后并不意味著你可以就此一勞永逸。在應(yīng)用層,除了從各種渠道獲取的數(shù)據(jù)之外,處理和分析數(shù)據(jù)的能力也格外重要,通俗點(diǎn)說(shuō),就是有了數(shù)據(jù)你要知道怎么用。宋繼強(qiáng)認(rèn)為,這其中的關(guān)鍵是端到端的集成。
智能終端的種類(lèi)很多,它們采集來(lái)的數(shù)據(jù)種類(lèi)很多,通常不是傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),而是非結(jié)構(gòu)化的數(shù)據(jù),怎么樣能夠很好的利用云端和終端協(xié)同計(jì)算能力和它們之間無(wú)縫并且高速的傳輸能力、存儲(chǔ)能力,構(gòu)建端到端的解決方案,構(gòu)成一個(gè)良性循環(huán)。也就是采集了數(shù)據(jù),做了處理,送到云端以后,在云端繼續(xù)分析它,去提取出中間有用的價(jià)值,并且能夠有一些是可以增值,讓終端更智能的再下發(fā)到終端,這樣一個(gè)反復(fù)的循環(huán),是一個(gè)最優(yōu)的途徑,這是我們深刻相信的未來(lái)的場(chǎng)景。
人工智能從60年前被提出,到現(xiàn)在已經(jīng)發(fā)展到了一個(gè)新的高度,人工智能已經(jīng)逐漸融入到了人們的生活當(dāng)中,不過(guò)在宋繼強(qiáng)看來(lái),現(xiàn)在的人工智能并不成熟。“20年后再來(lái)看,歷史的發(fā)展長(zhǎng)河里面,現(xiàn)在人工智能仍然處在一個(gè)早期階段?!?/p>
宋繼強(qiáng)給出了三個(gè)評(píng)價(jià)技術(shù)是否已經(jīng)達(dá)到了成熟階段的標(biāo)準(zhǔn):
第一,看它的應(yīng)用是否已經(jīng)普及到各行各業(yè),還是你只在一小塊產(chǎn)業(yè)里去提供價(jià)值,所以一個(gè)是應(yīng)用的廣泛度。
第二,是否已經(jīng)有標(biāo)準(zhǔn),不管是國(guó)家標(biāo)準(zhǔn)還是行業(yè)標(biāo)準(zhǔn),是否已經(jīng)有標(biāo)準(zhǔn)開(kāi)始在制定和落地。
第三,是否已經(jīng)有專(zhuān)用的硬件開(kāi)始在市面上使用,而且第三點(diǎn)也是比較重要的,大家知道做硬件,第一個(gè)花錢(qián),第二個(gè)周期長(zhǎng),產(chǎn)業(yè)沒(méi)起來(lái)之前,硬件廠商是不會(huì)鋪進(jìn)去的。
英特爾聯(lián)合創(chuàng)始人Robert Noyce曾表示,“一直以來(lái),我們通過(guò)計(jì)算機(jī)建模的方式來(lái)探究大腦如何工作?;蛟S我們應(yīng)該反其道而行之,為了探索計(jì)算機(jī)的未來(lái)發(fā)展方向,我們應(yīng)該向大腦尋求答案?!彼卫^強(qiáng)在大會(huì)上也表示,怎么利用我們?cè)谀X科學(xué)上得到的一些認(rèn)知和新奇的想法,去促進(jìn)計(jì)算機(jī)科學(xué)或者計(jì)算架構(gòu)的發(fā)展,為這個(gè)領(lǐng)域提供更好的計(jì)算能力,這是業(yè)界需要考慮的。
通常我們?cè)谧鲇布臅r(shí)候,必須要走這樣的過(guò)程。
宋繼強(qiáng)以深度學(xué)習(xí)舉了個(gè)例子:如果訓(xùn)練出一個(gè)深度學(xué)習(xí)模型,直接變成一個(gè)硬件是不太可能的,而且也是低效的,高效的辦法是去分析這個(gè)模型,而且必須找到懂這個(gè)模型的人、懂為什么產(chǎn)生這種模型,然后把這個(gè)模型通過(guò)硬件的描述給描述出來(lái),接下來(lái)是抽象出硬件中的數(shù)據(jù)流。這里會(huì)涉及到很多問(wèn)題,數(shù)據(jù)是怎么流的?中間的流水線上有哪些重要處理模塊?它們各自的時(shí)間、帶寬要求是怎么樣?有哪些計(jì)算的原語(yǔ)?在這樣的基礎(chǔ)上,做硬件芯片就有很好的認(rèn)識(shí),我們能知道哪些放在硬件里面固化,哪些是去靈活使用,有了這樣的認(rèn)知以后,就可以產(chǎn)生出一個(gè)針對(duì)這種工作,這種工作負(fù)載優(yōu)化的硬件。
如果這個(gè)產(chǎn)業(yè)真的發(fā)展到了一個(gè)普及,那就需要專(zhuān)業(yè)模型,而不是在通用的芯片上做模擬。
雖然宋繼強(qiáng)在大會(huì)現(xiàn)場(chǎng)表示英特爾不是人工智能領(lǐng)域的專(zhuān)家,但英特爾近一年來(lái)在這一領(lǐng)域做出的投入并不少。他說(shuō),英特爾正在做的就是終端到云端的解決方案,例如中間的通訊鏈路、存儲(chǔ)等。
在云端方面,雷鋒網(wǎng)曾報(bào)道,今年11月英特爾推出了代號(hào)為L(zhǎng)ake Crest的芯片,這是一款專(zhuān)門(mén)為深度學(xué)習(xí)定制的處理器。宋繼強(qiáng)在現(xiàn)場(chǎng)介紹了這款芯片的特點(diǎn):第一,它里面的運(yùn)算設(shè)計(jì)是為了深度學(xué)習(xí)量身定制,同時(shí)它的計(jì)算密度也非常高;第二,它突破了多節(jié)點(diǎn)之間數(shù)據(jù)訪問(wèn)的瓶頸;第三,支持高速的內(nèi)存,這個(gè)高速內(nèi)存是使用HBM2的內(nèi)存,直接封裝在一個(gè)芯片的。
這樣的設(shè)計(jì)意味著什么?
在做深度學(xué)習(xí)訓(xùn)練的時(shí)候,即使你的模型、神經(jīng)網(wǎng)絡(luò)的每一個(gè)節(jié)點(diǎn)里面既有計(jì)算也有數(shù)據(jù),而且數(shù)據(jù)有的還是浮點(diǎn)的,希望是每個(gè)計(jì)算節(jié)點(diǎn)有自己的內(nèi)存接口,這個(gè)要求還不是那么容易滿足,現(xiàn)在我們可以通過(guò)這個(gè)硬件技術(shù)支持到這一點(diǎn),你有了這個(gè)支持,意味著我首先設(shè)計(jì)的模型,我在做很多算法訓(xùn)練的時(shí)候,我的尺寸大小不受太大的限制。因?yàn)楹芏嗳嗽诔跏荚O(shè)計(jì)的時(shí)候不考慮功耗,不考慮代價(jià)成本,去做出來(lái),但是這時(shí)候是需要允許你去做這么大模型的平臺(tái)的,同時(shí)IO增加,你也可以知道是多少增加。
除此之外,在硬件方面,至強(qiáng)、至強(qiáng)融核的技術(shù)以及Arria FPGA也都是英特爾在人工智能硬件上不可或缺的產(chǎn)品線,這些人工智能的硬件和方案都屬于英特爾Nervana平臺(tái)的產(chǎn)品。
反觀在算法的研究上,英特爾更多的是與學(xué)術(shù)界合作,合作的方向也是多元化的:如何加快訓(xùn)練的速度,以及更好的利用少一些的數(shù)據(jù)和少一些的監(jiān)督,來(lái)達(dá)到訓(xùn)練的特性;怎么把大模型稀疏化和修剪,因?yàn)楝F(xiàn)在模型和參數(shù)非常多,但實(shí)際有用的卻寥寥無(wú)幾,這對(duì)存儲(chǔ)和計(jì)算會(huì)造成巨大的浪費(fèi),所以怎么做好大量模型的稀疏化,以提升效率;第三點(diǎn)是怎么支持更大規(guī)模的計(jì)算,例如在云端可以同時(shí)做運(yùn)算,在每個(gè)節(jié)點(diǎn)用更高階的方法做處理。
毋庸置疑,這些技術(shù)可以大幅增加模型的并行化計(jì)算能力,而未來(lái)英特爾也將推出更先進(jìn)的Knights Crest。宋繼強(qiáng)還透露了英特爾的一個(gè)小目標(biāo),到2020年,在英特爾軟硬件方案的集成下,深度學(xué)習(xí)模型的訓(xùn)練時(shí)間可以縮短100倍。
在數(shù)據(jù)爆發(fā)且對(duì)計(jì)算性能要求苛刻的時(shí)代,云端固然重要,但對(duì)實(shí)時(shí)性要求高的應(yīng)用而言,終端的處理能力也不容忽視。今年9月,英特爾收購(gòu)了視覺(jué)處理芯片商Movidius,這是英特爾在人工智能終端上布局的代表作。在宋繼強(qiáng)看來(lái),終端嵌入AI是未來(lái)的一大趨勢(shì),它有更高的能效、更低的寬帶需求、更低的延遲,而且對(duì)存儲(chǔ)的消耗更少,容錯(cuò)連續(xù)性也更好。
最近一兩年,國(guó)內(nèi)外科技巨頭已經(jīng)紛紛把目光聚焦在了人工智能,但正如宋繼強(qiáng)所言,人工智能依然處于早期階段,創(chuàng)業(yè)團(tuán)隊(duì)依然可以從中找準(zhǔn)自己的角色,例如,無(wú)人駕駛、精準(zhǔn)醫(yī)療、智慧城市、互聯(lián)網(wǎng)金融等都將蘊(yùn)藏著巨大的機(jī)遇。
AI的整個(gè)市場(chǎng)仍然處于嬰兒期,想投身于利用AI做后面的各種產(chǎn)業(yè)的公司和學(xué)者來(lái)講,時(shí)尤未晚,還有很多事情可以做。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章