1
本文作者: 大牛講堂 | 2017-03-06 16:18 |
2017年2月的最后一天,北京大學(xué)“人工智能前沿與產(chǎn)業(yè)趨勢(shì)”研究生課第二講如約和同學(xué)見面。課程依舊由北大人工智能創(chuàng)新中心主任、百度七劍客之一、酷我音樂創(chuàng)始人雷鳴老師坐鎮(zhèn),而邀請(qǐng)的嘉賓則是地平線機(jī)器人創(chuàng)始人&CEO、中組部“”國(guó)家特聘專家、機(jī)器學(xué)習(xí)專家、互聯(lián)網(wǎng)人工智能領(lǐng)域全球領(lǐng)導(dǎo)者之一余凱博士。
本講圍繞的主題是嵌入式人工智能,涉及了嵌入式人工智能的本質(zhì)特征、軟硬件結(jié)合聯(lián)合優(yōu)化、應(yīng)用場(chǎng)景及未來的發(fā)展機(jī)會(huì)等等,亮點(diǎn)頗多。
余凱博士首先以“人工智能的邊緣機(jī)會(huì)”為切入點(diǎn),做了時(shí)長(zhǎng)50分鐘的演講。之后雷鳴登臺(tái),和余凱就“人工智能的專用性和通用性”、“在軟硬件聯(lián)合優(yōu)化的過程中如何良好同步”等問題展開了對(duì)話和討論。
下面是完整的課程實(shí)錄。(內(nèi)容豐富,文末鏈接可直通現(xiàn)場(chǎng)視頻)
余凱演講全文
謝謝雷鳴,我的老朋友,好哥們兒。其實(shí)雷鳴老師是我們所有百度人的前輩,百度的七劍客之一。今天我也非常感動(dòng),能來到北大和在座的老師和同學(xué)們分享一些關(guān)于人工智能的看法。我記得很早之前也來北大做過深度學(xué)習(xí)的講座,距離現(xiàn)在也有些時(shí)間了,這期間我個(gè)人的身份也發(fā)生了一些轉(zhuǎn)變。
在過去的兩年間,人工智能變成了一個(gè)非常 sexy 的話題。那么,What’s the hype? 這里面是否真正有一些實(shí)在的因素在推動(dòng)?我昨天到今天一直在非常認(rèn)真地在準(zhǔn)備今天這個(gè)講座,因?yàn)檫@也是雷鳴老師給我布置的一個(gè)作業(yè)。
在座的從事人工智能相關(guān)學(xué)習(xí)或研究的有不少。我記得我自己大學(xué)一、二年級(jí)的時(shí)候是在學(xué)習(xí)用 FORTUNE,C 語言編程,而今日來找我請(qǐng)教的大一、大二的同學(xué)會(huì)跟我探討如何建模去識(shí)別女孩子飾品這類的問題,所以說computing science 在過去講的是 computing,而如今關(guān)注的是 data science,變成了 data-driven 的 computing science,統(tǒng)計(jì)的、大數(shù)據(jù)的、計(jì)算的建模越來越多。
過去是big data, big model, big computing這三個(gè)因素在推動(dòng)學(xué)術(shù)研究和產(chǎn)業(yè)發(fā)展。所有的計(jì)算從 PC 到移動(dòng)設(shè)備有一種聚合的趨勢(shì),聚合到云計(jì)算、數(shù)據(jù)中心。但是天下之事,分久必合合久必分,在未來的十到二十年,我認(rèn)為很多計(jì)算會(huì)到互聯(lián)網(wǎng)的邊緣,會(huì)到我們的 device 端,甚至有些還是在不聯(lián)網(wǎng)或無線聯(lián)網(wǎng)環(huán)境下,依賴電池或本地的動(dòng)力支持如發(fā)動(dòng)機(jī)去進(jìn)行本地的計(jì)算。
▼
今天我想跟大家更多地分享一下我個(gè)人關(guān)于產(chǎn)業(yè)向前發(fā)展的思考,一些“干貨”。我今天提出一個(gè)新的類別,叫做嵌入式人工智能,意為不是在云計(jì)算或數(shù)據(jù)中心而是在互聯(lián)網(wǎng)的邊緣。我認(rèn)為從現(xiàn)在開始,我們會(huì)看到從邊緣開始的一種革命,正如從2012開始深度學(xué)習(xí)所引起的革命,一般來說,革命都是從邊緣開始的。2012年4月我在西安一次會(huì)議上作了一個(gè)關(guān)于深度學(xué)習(xí)的講座,那時(shí)深度學(xué)習(xí)還是一個(gè)處于邊緣的課題,而如今已發(fā)展為風(fēng)暴的中心。當(dāng)今人工智能的計(jì)算大多數(shù)都在 BAT 的數(shù)據(jù)中心,在云上面,但我們會(huì)發(fā)現(xiàn),有一個(gè)巨大的機(jī)會(huì)遠(yuǎn)離數(shù)據(jù)中心,在互聯(lián)網(wǎng)的邊緣。
我這個(gè)想法是從哪里來的呢?先從我個(gè)人的經(jīng)歷談起,我自己在深度學(xué)習(xí)這個(gè)領(lǐng)域工作了二十多年,之前在美國(guó)硅谷的NEC Labs領(lǐng)導(dǎo)一個(gè)計(jì)算機(jī)視覺小組,也是世界上第一個(gè)做相關(guān)項(xiàng)目的小組。我的小組在2010年第一屆ImageNet Challenge上拿到全球第一名。
2012年回國(guó)加入百度,創(chuàng)立了業(yè)界首個(gè)人工智能中心 IDL Center,如今已是業(yè)界最具影響力的人工智能中心,我至今還認(rèn)為它非常出色,匯聚了很多優(yōu)秀的人才,包括百度的自動(dòng)駕駛團(tuán)隊(duì),中國(guó)最早的自動(dòng)駕駛項(xiàng)目。
雖然我博士畢業(yè)以來一直在工業(yè)領(lǐng)域發(fā)展,但我與學(xué)術(shù)界一直保持著緊密的聯(lián)系。分享一個(gè)小片段,2009年參與 ICML(International Conference of Machine Learning,)時(shí)我和幾位朋友共同組織了一個(gè)關(guān)于深度學(xué)習(xí)的 workshop,日后這幾位朋友分別加入了 APPLE、Google、Facebook 這樣的大企業(yè)去建立人工智能中心。可以看到這樣一個(gè)現(xiàn)象,就是深度學(xué)習(xí)在很短的時(shí)間內(nèi)迅速影響了世界上最偉大的高科技公司。
2014年我也引薦 Andrew Ng,也是我多年的朋友,加入了百度,這是首次有全球知名的 technical leader 加入中國(guó)公司,在國(guó)內(nèi)外都引發(fā)巨大震動(dòng),我至今都引以為傲。
我個(gè)人認(rèn)為未來原創(chuàng)技術(shù)改變世界的創(chuàng)舉一定會(huì)從中國(guó)發(fā)生,這也是我加入百度的原因,我初到百度做自我介紹時(shí)談過,我希望未來大家談到人工智能領(lǐng)域的頂級(jí)公司不僅只想到 Google,也會(huì)談到百度。我想這點(diǎn)在今日應(yīng)該已經(jīng)實(shí)現(xiàn)了,中國(guó)人工智能領(lǐng)域處于前沿位置的公司就是百度。
▼新摩爾定律
今天我們不談深度學(xué)習(xí)的算法,而是去探討一個(gè)正在發(fā)生或是下一個(gè)發(fā)生的風(fēng)暴是什么。我從2013年年底開始思考未來,認(rèn)為未來有三大趨勢(shì),第一個(gè)我稱之為新摩爾定律。摩爾定律在過去的二三十年推動(dòng)整個(gè)全球科技界在向前發(fā)展。摩爾定律指每十八至二十四個(gè)月,計(jì)算機(jī)的成本會(huì)下降一半,性能則會(huì)提升一倍,使計(jì)算和應(yīng)用不斷發(fā)展,按此規(guī)律推算,到2045年,每1000美元可以買到的計(jì)算資源幾乎就等同于今天人腦的計(jì)算能力,即目前天河二號(hào)的計(jì)算能力,天河二號(hào)的功耗為1000萬瓦,而人腦只有20瓦。
到2045年是不是會(huì)這樣呢?Intel 已經(jīng)于去年正式宣布摩爾定律已經(jīng)守不住了,速度已經(jīng)放緩。那么到底是什么因素會(huì)去推動(dòng)整個(gè)計(jì)算向前發(fā)展呢?
整個(gè)摩爾定律已經(jīng)在按另外一個(gè)軌道在發(fā)展,已經(jīng)不是每個(gè)單位面積上晶體管的數(shù)目,而是架構(gòu)的改進(jìn),使得計(jì)算由邏輯運(yùn)算向人工智能運(yùn)算演進(jìn)。那么人工智能運(yùn)算是提升 CPU 工藝向前發(fā)展,還是設(shè)計(jì)一個(gè)新架構(gòu),這是個(gè)問題。
讓我們來看一下人腦是怎樣工作的。我們的人腦是 general 的、像 CPU 一樣的 computer,還是一個(gè) special purpose 的 computer?人腦是一個(gè)特殊硬件還是一個(gè)通用計(jì)算的硬件?認(rèn)為是通用計(jì)算的請(qǐng)舉手(不少同學(xué)都舉起手來)。
還是有不少同學(xué)這么認(rèn)為。人腦確實(shí)很發(fā)達(dá),有很強(qiáng)的計(jì)算能力,但如果你認(rèn)為這樣人腦就是通用計(jì)算的硬件了,那我來問一下,你看你能回答這個(gè)問題嗎?(PPT 上顯示:1729×568=?)你會(huì)發(fā)現(xiàn),面對(duì)這樣一個(gè)簡(jiǎn)單的問題,你會(huì)覺得如此的無奈。你會(huì)發(fā)現(xiàn),人腦不是無所不能的,它的能力明顯有邊限。
當(dāng)然人腦有它擅長(zhǎng)的東西,比如這個(gè)(PPT 上出現(xiàn)了一段在一定程度上打亂了順序的文字,現(xiàn)場(chǎng)觀眾驚訝地發(fā)現(xiàn),這并不影響閱讀,甚至有人都沒有發(fā)現(xiàn)順序被打亂了)。
我們發(fā)現(xiàn),原來大腦是這么奇妙,這么特殊,它的機(jī)制可能和現(xiàn)在顯示器的逐行掃描、順序掃描是完全不同的機(jī)制。它對(duì)圖像是并行處理的,因此對(duì)順序是不敏感的。但是背后又有一個(gè) language model,還有一個(gè)類似于 recurrent neural net 的東西在進(jìn)行 correct。
我們發(fā)現(xiàn),原來人腦是有所長(zhǎng)、有所短的。在漫長(zhǎng)的進(jìn)化過程中,人在不斷地發(fā)展和自己生存有關(guān)的能力,而和生存無關(guān)的能力,發(fā)展則是不足的。所以說,人腦是一個(gè)特殊設(shè)計(jì)的硬件。同時(shí)人腦還有很多個(gè)不同的子系統(tǒng),比如有一部分是專門對(duì)聽覺優(yōu)化的,有一部分是專門對(duì)視覺優(yōu)化的,前幾年有一個(gè)獲得諾貝爾獎(jiǎng)的發(fā)現(xiàn),發(fā)現(xiàn)人腦中有一塊是專門負(fù)責(zé)定位的,相當(dāng)于 GPS。
我們看到,如果我們做通用處理器,做 CPU,那么它可能非常 flexible,因?yàn)樗梢宰龊芏嗳蝿?wù)。但它整個(gè) efficiency 并不高。但如果針對(duì)每個(gè)人物做專門的優(yōu)化,會(huì)把 efficiency 提高兩到三個(gè)數(shù)量級(jí)。
給大家講一個(gè)我自己經(jīng)歷的故事。2011年,谷歌大腦的項(xiàng)目,當(dāng)時(shí)都是用 CPU 來做的計(jì)算。當(dāng)時(shí)我們加入百度,開始在百度做深度學(xué)習(xí)計(jì)算,用的是 GPU。我們私下里不斷的比較,比較 CPU 跟 GPU 的效率。
2012年的 GPU 比 CPU 效率大概要快四十倍左右,但是 Google 的一些人告訴我們,他們的 CPU 優(yōu)化的非常好,據(jù)說能達(dá)到 CPU 跟 GPU 只是六倍的difference。但是我們覺得很難相信,這一點(diǎn)就跟我們的數(shù)據(jù)太不一樣了。我們覺得 GPU 做深度神經(jīng)網(wǎng)絡(luò)的性能明顯要更高嘛。不管怎么說,我們開始 launch 我們的系統(tǒng),大規(guī)模使用 GPU 來做計(jì)算,到后來證明我們是對(duì)的。Google 后來也開始大規(guī)模地使用GPU。
所以實(shí)際上,百度比 Google 更早使用 GPU。所以 Andrew 在2014年5月份加入百度,他接受采訪時(shí)說,當(dāng)時(shí)加入百度的原因,當(dāng)然除了余凱,另外還有一個(gè)原因,就是可以隨便買 GPU。
到了14年,廣告系統(tǒng)上線跟語音系統(tǒng)上線都需要實(shí)時(shí)計(jì)算,并且它的流量特別大,特別是廣告,這種情況下 CPU 跟 GPU 其實(shí)都扛不住,所以我們當(dāng)時(shí)用 FPGA 去做專門的硬件加速。這時(shí)我們更加清醒地認(rèn)識(shí)到,硬件對(duì)計(jì)算力有多么重要。
▼從中心到邊緣
好,我們現(xiàn)在看另外一個(gè)趨勢(shì),這個(gè)趨勢(shì)就是從中心到邊緣。
我們可以看到從 PC 互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)到 internet of smart things,實(shí)際上對(duì) AI 的要求越來越高。對(duì) PC 互聯(lián)網(wǎng)來說,對(duì) AI 的要求其實(shí)沒有那么高,但在移動(dòng)互聯(lián)網(wǎng)上,這種要求出現(xiàn)了。
比如說最近我們看到今日頭條的新聞,它跟百度一個(gè)很不一樣的地方是百度是即搜即得,而今日頭條是不搜即得。這個(gè)“不搜即得”,在移動(dòng)設(shè)備上,因?yàn)樗幸粋€(gè)主動(dòng)去做推薦的機(jī)制,使得人機(jī)交和信息的獲取更加智能更加的高效。未來,這些移動(dòng)設(shè)備上,會(huì)有越來越強(qiáng)的AI需求。我們有很多的計(jì)算,會(huì)從數(shù)據(jù)中心往這些移動(dòng)設(shè)備上去轉(zhuǎn)移。在這些設(shè)備上,做 perception,做人機(jī)交互,還有決策等事情。
這些計(jì)算要求 low latency,沒有延遲,并且是實(shí)時(shí)的,low power,low cost,并且是 privacy protect 的。比如這在汽車上面,就是一個(gè)很大的一個(gè)應(yīng)用場(chǎng)景——不可能前面有小孩子突然橫穿馬路,你還要把數(shù)據(jù)傳上數(shù)據(jù)中心,處理完了以后再傳回來,這是不可想象的。所以一定要本地計(jì)算,要實(shí)時(shí)處理沒有延遲。
很多移動(dòng)設(shè)備,比如 Amazon 的 Echo,就是把很多計(jì)算往邊緣設(shè)備上去推,使得它整個(gè)的用戶體驗(yàn)會(huì)更好,這也是未來的一個(gè)趨勢(shì)。又比如監(jiān)控?cái)z像頭,中國(guó)去年一共部署了一億個(gè)。監(jiān)控?cái)z像頭的資料,其實(shí)存3個(gè)月就扔掉了。未來,對(duì)于所有這些攝像頭,都會(huì)有專門的處理器,去處理實(shí)時(shí)的視頻,這是一個(gè)大的趨勢(shì)。
孫正義認(rèn)為,很多計(jì)算未來會(huì)在邊緣進(jìn)行,邊緣的這些設(shè)備上的計(jì)算,使得這些設(shè)備變成了機(jī)器人。他認(rèn)為,15年以后,機(jī)器人的數(shù)目會(huì)超過人類,達(dá)到一百億個(gè)。孫正義基正是基于這樣一個(gè)邏輯,他以極高的溢價(jià)收購(gòu)了英國(guó)的 ARM,300多億美金。所以這是以 VC 的思維去做幾百億美金的巨型并購(gòu)。
▼邊緣的競(jìng)賽
第三個(gè)趨勢(shì),是在邊緣的競(jìng)賽,就是更快更高更強(qiáng)。比如今天的每輛車,有1個(gè)攝像頭,就是倒車的攝像頭,但未來的自動(dòng)駕駛是平均8到12個(gè)攝像頭。Tesla 的新車上,已經(jīng)有8個(gè)攝像頭了。然后每個(gè)攝像頭,會(huì)從720P的解析度到1080P的解析度,到高清的4k,因?yàn)榻馕龆仍礁?,你可以看得更遠(yuǎn)。
另外一點(diǎn),未來的10到20年時(shí)間,因?yàn)樽詣?dòng)駕駛技術(shù)的發(fā)展,會(huì)使得高速公路上的汽車的平均的速度從100公里每小時(shí)到接近它的物理的極限——200公里每小時(shí),速度會(huì)越來越快,這是一個(gè) global trend,這要求處理的數(shù)據(jù)量持續(xù)增長(zhǎng),所以在邊緣上,計(jì)算會(huì)持續(xù)的追求更快更高更強(qiáng),這是一個(gè)新的競(jìng)賽。
未來的5到10年,最具顛覆性的產(chǎn)業(yè)機(jī)會(huì)是什么?我跟大家分享一下我的思考。通常來講,產(chǎn)業(yè)機(jī)會(huì)分成兩個(gè)階段,通常的話,我們會(huì)看到,首先是一波2B的機(jī)會(huì)。2B的機(jī)會(huì),就是 Enabling Technology,公司就是做 technology 本身的。它是提供槍炮彈藥的,給誰提供呢?給第二波的機(jī)會(huì)提供。第二波的機(jī)會(huì)是什么呢?就是 Technology-enabled Business。當(dāng)然這些都是2C的。2B就是給 Enterprise 提供服務(wù)。這些 Enterprise 再去捕捉 consumer-orient 的機(jī)會(huì)。這個(gè) pattern確實(shí)在歷史上反復(fù)發(fā)生。
舉一個(gè)例子,當(dāng)年 PC 互聯(lián)網(wǎng)剛出現(xiàn)的時(shí)候,時(shí)間是在90年代末,那時(shí)沒有一家互聯(lián)網(wǎng)公司是掙錢的,大家都看到了這里面存在機(jī)會(huì),但在這個(gè)階段,首先要做的工作是把架構(gòu)、網(wǎng)絡(luò)給做起來吧? 所以 CISCO 這樣的公司會(huì)表現(xiàn)得更好。另外也會(huì)有一些2B的培訓(xùn)師等等,這個(gè)階段整體上屬于為B端造槍造炮提供彈藥的階段,這算是一種曲線救國(guó)吧。
然后才有2C的大的互聯(lián)網(wǎng)公司的出現(xiàn),比如 Google。再比如移動(dòng)互聯(lián)網(wǎng),首先要有 CDMA 這樣的軟件算法,放在芯片里面,使每個(gè)移動(dòng)設(shè)備 stay connected。然后才是 Apple 這樣的公司的崛起。中國(guó)的大部分投資者、創(chuàng)業(yè)者和企業(yè)家,他們看重的就是這樣一波機(jī)會(huì)。
在我們進(jìn)入這個(gè)市場(chǎng)的時(shí)候,美國(guó)人把這些基礎(chǔ)技術(shù)已經(jīng)做完了,從2000年開始到今天,我們是在享受上個(gè)世紀(jì)八九十年代科技成長(zhǎng)的所帶來的的一個(gè)環(huán)境,然后我們?nèi)プ隽诉@些用戶導(dǎo)向的企業(yè)。
但今天我們?nèi)タ催@個(gè)整個(gè)這個(gè)創(chuàng)業(yè)環(huán)境,2C的這種創(chuàng)新其實(shí)代價(jià)已經(jīng)非常的高昂,比如嘀嘀融了上百億美元,美團(tuán)也有幾十億美元,這個(gè)投資其實(shí)越來越沉重。其實(shí)你想想看,當(dāng)時(shí) Google 只融了兩千萬美元就上市了,百度差不多也就是千萬美元,騰訊也是如此。在那個(gè)時(shí)候其實(shí)有大把的機(jī)會(huì)去捕捉。但是現(xiàn)在的話呢?八九十年代技術(shù)創(chuàng)新所帶來的這些能力其實(shí)已經(jīng)被發(fā)掘的差不多了,所以我們會(huì)發(fā)現(xiàn)創(chuàng)新越來越沉重。
▼未來的機(jī)會(huì)
好,然后我們來看一下未來的機(jī)會(huì)。過去的12個(gè)月里,大概近半年的時(shí)間里,我們看到整個(gè)高科技行業(yè)有一個(gè)機(jī)會(huì),今天所有的這個(gè)二級(jí)市場(chǎng)投資者都開始研究它、關(guān)注他,這個(gè)讓他們覺得很 surprised。因?yàn)樵谡麄€(gè)高科技市場(chǎng)比較低迷的時(shí)候,有一只股票是 NVIDIA,從20塊錢到現(xiàn)在漲到差不多100塊錢,曾經(jīng)一度到119塊,在過去一年多的時(shí)間里成長(zhǎng)了5倍,是整個(gè)高科技市場(chǎng)成長(zhǎng)速度最快的一個(gè)機(jī)會(huì)。這里面核心的邏輯其實(shí)很簡(jiǎn)單,他就是造槍造炮嘛。
現(xiàn)在很多企業(yè),無論大小,即使不知道深度學(xué)習(xí)用來干什么,怎么掙錢,大家都要去搶購(gòu) GPU 這些。所以我們也非??粗剡@點(diǎn),希望做一個(gè)深度神經(jīng)網(wǎng)絡(luò)的這種處理器,讓大家能夠利用這些軟硬件結(jié)合的解決方案。
我們從一個(gè)更大的尺度來看,這是今年市值排名前20名的高科技公司,我們可以看到里面有8家是互聯(lián)網(wǎng)公司,還有8家是半導(dǎo)體公司。大家不要只看互聯(lián)網(wǎng)公司,其中有非常非常硬的科技公司,他們是很賺錢很賺錢的。八家硬科技公司里面成長(zhǎng)得最快的兩家,一家是 NVIDIA,一家是 AMD。
我們做深度學(xué)習(xí)的處理器也是因?yàn)榭吹搅诉@種趨勢(shì),就是軟件算法跟人工智能和半導(dǎo)體的結(jié)合會(huì)催生爆發(fā)式的成長(zhǎng)。我們的關(guān)注點(diǎn)是加速 inference 的效率,打造低功耗高性能的解決方案,讓很多 device 端也具有人工智能的能力。
如果把我們?nèi)ズ陀布S商相比較,他們?nèi)?yōu)化的是 number of operation per cost,但我們?nèi)?yōu)化的是什么呢?我們不是一個(gè)傳統(tǒng)的硬件廠商,我們實(shí)際上是軟硬結(jié)合的2B的生意,我們優(yōu)化的是 performance per cost。
我們首先從系統(tǒng)的角度來做優(yōu)化,我們會(huì)設(shè)計(jì)專門軟件算法的實(shí)驗(yàn)過程,然后根據(jù)這個(gè)軟件算法來設(shè)計(jì)一個(gè)硬件的架構(gòu),然后再用這個(gè)硬件架構(gòu),去優(yōu)化我們的軟件,最后通過 compiler 和 runtimelibrary 使軟硬件之間的差距更小。還有一個(gè)理念很重要,就是不要關(guān)注籠統(tǒng)的問題,而是要解決具體的任務(wù),否則復(fù)雜程度會(huì)讓你難以駕馭。通過軟硬件優(yōu)化,我們可以把性能提升兩到三個(gè)數(shù)量級(jí)。
我為什么認(rèn)為這個(gè)非常重要?跟大家分享我自己的親身經(jīng)歷,這是當(dāng)時(shí)百度第一輛自動(dòng)駕駛汽車,把這個(gè)后備箱打開,可以看到里面全是機(jī)器,最早里面有好多飛線,現(xiàn)在已經(jīng)做得很好了。但是散熱問題還沒有解決。
到今天為止,無論是百度還是 Google 的無人駕駛汽車,這些自動(dòng)駕駛的車每開兩個(gè)小時(shí)就要停下來散熱,因?yàn)槔锩鏌岬檬懿涣恕6焱耆恍枰_空調(diào)暖風(fēng)。
這個(gè)問題為什么難解決?功耗為什么降不下來?因?yàn)槟銢]有從系統(tǒng)級(jí)的層面來優(yōu)化整個(gè)東西。軟件框架不斷往前迭代,硬件架構(gòu)也需要相應(yīng)迭代,感知能力極大提升。自動(dòng)駕駛繼續(xù)發(fā)展的話,會(huì)發(fā)現(xiàn)感知能力不是最主要的,最主要的問題變成決策。
自動(dòng)決策方面的復(fù)雜程度超出想象。我們的目標(biāo)是打造一款芯片,功耗和成本只有目前市面上頂尖處理器的幾十分之一,但性能為其兩三倍。在下個(gè)月德國(guó)柏林的 BCW 會(huì)議上我們也會(huì)分享我們?cè)谧詣?dòng)駕駛方面軟件算法和處理器架構(gòu)的進(jìn)展。
喬布斯在手機(jī)上實(shí)現(xiàn)了去掉鍵盤和鼠標(biāo)操控,在平板上去掉了書寫筆,而我們的目標(biāo)就是用五年的時(shí)間把所有遙控工具全部去掉,完全實(shí)現(xiàn)人體感知,想要實(shí)現(xiàn)這一年就需要完全重構(gòu)軟件和硬件,讓處理器和真?zhèn)€系統(tǒng)的功耗足夠低,體積足夠小。我們不僅僅是做軟件算法,我們專注于自動(dòng)駕駛,智能家居和公共安全這三個(gè)垂直市場(chǎng),未來幾年這三個(gè)市場(chǎng)都會(huì)爆炸式的增長(zhǎng)。
▼關(guān)于人才
最后我想分享一下,人工智能改變世界,真正改變?nèi)斯ぶ悄?,改變世界的是人才?/strong>人工智能目前最缺的就是人才。這是我第一次在業(yè)界發(fā)表我的判斷和看法,我相信跟你們?cè)诿襟w上看到的都很不一樣,我愿意分享的原因就是我覺得雷鳴老師做的這一個(gè)研究中心非常有意義,因?yàn)槲覀內(nèi)狈Φ木褪侨瞬拧?/p> 我在斯坦福教課的時(shí)候有個(gè)學(xué)生,目前幾家全球前五十的人工智能公司都提到他做的公司。其實(shí)他這個(gè)公司初始的一個(gè)想法是當(dāng)時(shí)上我課的時(shí)候完成的一個(gè)項(xiàng)目。他當(dāng)時(shí)設(shè)計(jì)了一個(gè)簡(jiǎn)易的機(jī)器人來自動(dòng)識(shí)別蔬菜地的雜草并用生態(tài)的方式除草,本意是希望解決加州菜農(nóng)雇傭大批墨西哥非法移民除雜草的社會(huì)問題,同時(shí)獲實(shí)現(xiàn)無污染的蔬菜種植?;诖讼敕?,他日后真的做成了一個(gè)公司,今日美國(guó)有10%的生菜地都在使用他的機(jī)器人除草。能通過我與學(xué)生的交流幫助一些年輕人做成一些事情,對(duì)此我也感到很驕傲。 我過去還帶過兩個(gè)學(xué)生,一個(gè)后來在密歇根大學(xué)做教授,另一個(gè)目前是深度學(xué)習(xí)領(lǐng)域的旗手。楊健朝是我當(dāng)年帶過兩年的實(shí)習(xí)生,當(dāng)時(shí)我們倆合著的計(jì)算機(jī)視覺的論文在 CVPR 引用次數(shù)達(dá)到兩千多次,在這次會(huì)議中全球引用率最高。另一個(gè)實(shí)習(xí)生周曦,目前是中國(guó)最好的一家人臉識(shí)別公司云從科技的 CEO。賈楊清的導(dǎo)師推薦他來跟我做深度學(xué)習(xí),今天他開發(fā)的Caffe 在業(yè)界已經(jīng)如雷貫耳。李沐是我當(dāng)初招募的百度 IDL 少帥學(xué)者,他開發(fā)的 MXNET 是亞馬遜云計(jì)算的官方深度學(xué)習(xí)平臺(tái),影響世界的年輕人,非常了不起。另有兩名百度少帥學(xué)者李磊,今日頭條實(shí)驗(yàn)室主任,和顧嘉唯,麻省理工學(xué)院全球TR35創(chuàng)新者。 所以我鼓勵(lì)年輕人來地平線實(shí)習(xí)和工作,我相信地平線現(xiàn)在所做的事情是站在時(shí)代前沿,提供足夠激動(dòng)人心的成長(zhǎng)和學(xué)習(xí)機(jī)會(huì)。 我們做的事情從軟件到硬件,到編譯器,到操作系統(tǒng),去改變駕駛,改變機(jī)器人,去應(yīng)用到未來的方方面面。我覺得我也愿意去跟大家一起去成長(zhǎng)。我們對(duì)于增量性的創(chuàng)新沒有興趣,我們要做的是顛覆性的創(chuàng)新。這就是我今天的分享。謝謝! 雷鳴對(duì)話余凱:人工智能的邊緣機(jī)會(huì) 我們從演講實(shí)錄中特別拈出“嵌入式人工智能——從邊緣開始的革命”這一話題,為讀者呈現(xiàn)當(dāng)日課程的精彩片段。 ▼邊緣機(jī)會(huì)將會(huì)是未來的風(fēng)暴 宣講一開始,余凱老師首先表示,他是來講干貨的。當(dāng)你剛以為他要走技術(shù)路線,他卻又說,今天他也不談深度學(xué)習(xí)、生成對(duì)抗網(wǎng)絡(luò)等等。他希望和大家分享的是他的“思考”。這一思考的對(duì)象,就是嵌入式人工智能。 他認(rèn)為目前嵌入式人工智能不在數(shù)據(jù)中心,不在云上面,而是處在互聯(lián)網(wǎng)的邊緣?!案锩鶑倪吘夐_始,”余凱老師說,“星星之火,可以燎原?!彼e了農(nóng)村包圍城市的例子?!吧疃葘W(xué)習(xí)幾年前還處在一個(gè)邊緣的地位,而今已經(jīng)成為風(fēng)暴的中心。 今天我們的人工智能計(jì)算,大部分都在BAT的數(shù)據(jù)中心,在云上面,而我今天要向大家展示的,正是這樣一個(gè)邊緣機(jī)會(huì),它遠(yuǎn)離BAT,遠(yuǎn)離云,卻是一個(gè)正在形成的風(fēng)暴?!?/p> 對(duì)于這個(gè)形成中的風(fēng)暴,余凱老師從兩個(gè)角度進(jìn)行了表述,或者說論證,首先是商業(yè)的角度。余凱老師認(rèn)為,從人工智能當(dāng)前的發(fā)展情況看,應(yīng)用的場(chǎng)景首先是to B,然后才是to C。這一路徑在PC互聯(lián)網(wǎng)的崛起和移動(dòng)互聯(lián)網(wǎng)的崛起過程中都看得很清楚。 “比如90年代末,那時(shí)沒有一家互聯(lián)網(wǎng)公司是掙錢的,大家都看到了這里面存在機(jī)會(huì),但在這個(gè)階段,首先要做的工作是把架構(gòu)、網(wǎng)絡(luò)給做起來吧? 所以 CISCO 這樣的公司會(huì)表現(xiàn)得更好。然后才有to C的大的互聯(lián)網(wǎng)公司的出現(xiàn),比如 Google。再比如移動(dòng)互聯(lián)網(wǎng),首先要有 CDMA 這樣的創(chuàng)新,高通把這樣的軟件算法放在芯片里面做to B的生意,然后才是 Apple 這樣的to C公司的再次崛起。中國(guó)的大部分投資者、創(chuàng)業(yè)者和企業(yè)家都是2000年以來成長(zhǎng)起來,只看到這樣一波to C的機(jī)會(huì),而不太了熟悉美國(guó)80-90年代核心技術(shù)突破而導(dǎo)致的to B的巨大機(jī)會(huì)?!?/p> ▼什么是“邊緣機(jī)會(huì)” “我們從一個(gè)更大的尺度來看,這是今年市值排名前20名的高科技公司,我們可以看到里面有8家是互聯(lián)網(wǎng)公司,還有8家是半導(dǎo)體公司。大家不要只看互聯(lián)網(wǎng)公司啊,其中有非常非常硬的科技公司,他們是很賺錢很賺錢的!” 余凱老師點(diǎn)明了他認(rèn)為的“邊緣機(jī)會(huì)”:“如果把我們?nèi)ズ陀布幚砥鲝S商相比較,他們?nèi)?yōu)化的是什么?是單位成本下的計(jì)算性能,但我們?nèi)?yōu)化的是什么呢,我們不是一個(gè)傳統(tǒng)的硬件廠商,我們實(shí)際上是軟硬結(jié)合的toB的生意,我們從系統(tǒng)的角度來做優(yōu)化,我們會(huì)設(shè)計(jì)專門軟件算法的實(shí)驗(yàn)過程,然后根據(jù)這個(gè)軟件算法來設(shè)計(jì)一個(gè)硬件的架構(gòu),然后再用這個(gè)硬件架構(gòu),去優(yōu)化我們的軟件?!?/p> 正如前文所說,余凱老師認(rèn)為的邊緣機(jī)會(huì),是人工智能領(lǐng)域to B的系統(tǒng)優(yōu)化服務(wù),具體來說,可以表述為嵌入式專用人工智能系統(tǒng),其物理形式,可能是一個(gè)小小的芯片。但其中蘊(yùn)含了軟硬件結(jié)合聯(lián)合優(yōu)化的復(fù)雜過程。 “我為什么認(rèn)為這個(gè)非常重要?跟大家分享我自己的親身經(jīng)歷,這是當(dāng)時(shí)百度第一輛自動(dòng)駕駛汽車,把這個(gè)后備箱打開,可以看到里面全是機(jī)器,最早里面有好多黑線,當(dāng)然現(xiàn)在已經(jīng)做得很好了。但是散熱問題還沒有解決。到今天為止,無論是百度還是 Google 的無人駕駛汽車,這些自動(dòng)駕駛的車每開兩個(gè)小時(shí)就要停下來散熱,因?yàn)槔锩鏌岬檬懿涣?。冬天完全不需要開空調(diào)暖風(fēng)。這個(gè)問題為什么難解決?功耗為什么降不下來?因?yàn)槟銢]有從系統(tǒng)級(jí)的層面來優(yōu)化整個(gè)東西。軟件框架不斷往前迭代,硬件框架需要相應(yīng)迭代,這個(gè)架構(gòu)的優(yōu)化是非常復(fù)雜的,復(fù)雜到超出想象?!?/p> ▼尋找出路:軟硬件的聯(lián)合優(yōu)化 “如何定義嵌入式系統(tǒng)和通用計(jì)算系統(tǒng)?你現(xiàn)在的項(xiàng)目,是一種非常專用的小芯片,還是有很大的通用性?” 雷鳴老師的問題一開始波瀾不驚。 余凱老師回應(yīng):“隨著新的摩爾定律的出現(xiàn),我們會(huì)看見越來越多的專用架構(gòu)設(shè)計(jì),因?yàn)樗仨氠槍?duì)特殊的任務(wù)去做專門的優(yōu)化,比如我們有專門的視覺神經(jīng)網(wǎng)絡(luò),它的結(jié)構(gòu)跟聽覺神經(jīng)網(wǎng)絡(luò)其實(shí)是很不一樣的,跟我們負(fù)責(zé)定位的大腦部分其實(shí)也很不一樣。 “當(dāng)你的計(jì)算能力很難繼續(xù)突破的時(shí)候,比如說量子計(jì)算還沒有實(shí)現(xiàn)的時(shí)候,只有進(jìn)行專門的優(yōu)化,我們才能夠繼續(xù)往前奔跑,去實(shí)現(xiàn)特定場(chǎng)景下面的摩爾定律。所以,我認(rèn)為我們會(huì)朝特殊定制化這個(gè)方向去走,但是這種特殊定制化的任務(wù)其實(shí)也沒有太多,比如我們的大腦功能,也就是基本的視覺、聽覺、三維感知等。所以說專門化是嵌入式的一個(gè)本質(zhì)特征。 “另外一點(diǎn),就是低功耗,一定要低!無人機(jī)本來可以飛個(gè)兩個(gè)小時(shí),結(jié)果只能飛3分鐘。再比如汽車,因?yàn)榈男履茉雌嚻鋵?shí)都是燒電池的,跑5百公里和只能跑50公里,這是很不一樣的。所以這方面如果不去做這種專門的優(yōu)化,未來的電動(dòng)車也很難往前發(fā)展。 “另外我認(rèn)為這里需要軟件跟硬件的聯(lián)合優(yōu)化,聯(lián)合優(yōu)化是什么意思呢?本質(zhì)上來講,應(yīng)該是一個(gè)軟件,比如地平線本質(zhì)上是一個(gè)軟件公司,但我們只不過是把一部分東西給硬件化了而已。所以我基本上總結(jié)了3個(gè)方面。第一,專業(yè)化,使摩爾定律繼續(xù)往前;第二,低功耗,低功耗,低功耗!第三,軟硬結(jié)合。” ▼如何看待理想和現(xiàn)實(shí)的矛盾 “專業(yè)化過程中需要解決問題,比如解決聽覺方面的問題。解決完之后,我們又進(jìn)行軟硬結(jié)合,但現(xiàn)在算法迭代,速度非???,那么硬件化之后,新的算法怎么辦?會(huì)不會(huì)我們這批東西出來以后,過了半年,其實(shí)它的性能比起新的東西,已經(jīng)差了很多。這個(gè)矛盾在實(shí)際過程中是怎么去應(yīng)付的?” 余凱老師回應(yīng):“對(duì),這是做硬件的一個(gè)很大的風(fēng)險(xiǎn)。軟件算法不斷的每3個(gè)月往前去迭代,3個(gè)月以后的最好的算法跟現(xiàn)在比又很不一樣,所以硬件投入的話資金成本很高,一個(gè)處理器從投入到最后形成戰(zhàn)斗力要3年時(shí)間,這個(gè)時(shí)間跟你投多少錢沒關(guān)系,因?yàn)槟惚仨毜靡徊揭徊綇募軜?gòu)到設(shè)計(jì),然后到驗(yàn)證到后端到封裝等等。 “還包括軟件,包括系統(tǒng)軟件,所以這個(gè)迭代的速度非常的慢,這很難駕馭。像我們的話,實(shí)際上,都是軟件跑到前面,我們基本上把很多軟件算法的研發(fā)都已經(jīng)跑到明年了,我覺得創(chuàng)業(yè)就是要賭。如果什么東西都看到,完全放在桌面上,你才去做的話,那不叫創(chuàng)業(yè),那叫工作?!?/p> 雷鳴老師談了自己的想法:“我談?wù)勎易约旱囊稽c(diǎn)想法,剛才看到你說了新的架構(gòu),我們從性能到成本,再到所謂的效果上來看,我剛才算了一下,你在性能上能取得很大提升對(duì)吧?我們說摩爾定律基本上一兩年也就翻一翻,所以我覺得,感覺上如果你做專用的東西,比起通用的,其實(shí)在很多地方,一兩年的時(shí)間還是有的,這是做這件事的優(yōu)勢(shì)。第二點(diǎn),我在想,如果說你有通用計(jì)算加軟件優(yōu)勢(shì)的話,硬件其實(shí)大家都是一樣的。所以,你比別人先做,那你就是有優(yōu)勢(shì)的?!?/p> 余凱老師表示認(rèn)同:“對(duì),推動(dòng)解決方案,比起單獨(dú)的專用硬件,一個(gè)明顯的困難是在執(zhí)行層面。困難在于節(jié)奏感,要是一下錯(cuò)位了,成本跟時(shí)間的投入就讓創(chuàng)業(yè)者一下子萬劫不復(fù)。這本來就很難,創(chuàng)業(yè)本來就是在刀鋒上面行走?!?/p> 雷鳴老師則繼續(xù)指出這一邊緣機(jī)會(huì)的另一優(yōu)勢(shì):“我覺得好在,也許你在這個(gè)這個(gè)路上走的時(shí)候并沒有那么多人跟你競(jìng)爭(zhēng),所以,中間的話我覺得還能讓我們?nèi)シ敢恍╁e(cuò)誤。而如果現(xiàn)在在做移動(dòng)互聯(lián)網(wǎng)時(shí)犯任何一個(gè)小錯(cuò),機(jī)會(huì)就沒有了?!?/p> —END— 雷鋒網(wǎng)按:本文由地平線大牛講堂授權(quán)發(fā)布,如需轉(zhuǎn)載請(qǐng)聯(lián)系原作者,并注明作者和出處,不得刪減內(nèi)容。有興趣可以關(guān)注公號(hào)【地平線機(jī)器人技術(shù)】,了解最新消息。 雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。