0
雷鋒網(wǎng)注:本文整理奇點·創(chuàng)新者峰會演講嘉賓 NVIDIA 全球副總裁張建中的演講(文字有刪減):
NVIDIA 發(fā)明了一項技術(shù)叫 GPU,20 年前就用在視覺計算上。今天, NVIDIA 幾乎所有的業(yè)務(wù)都是來自于 GPU 這個核心技術(shù)上:
第一個業(yè)務(wù)就是年輕人喜歡的游戲;第二是用于做專業(yè)的圖形圖象設(shè)計,大型電影動漫作品都是用 GPU 渲染而來;第三是用來處理人工智能、高性能計算;;第四是汽車的自動駕駛。
NVIDIA 的 GPU 在今年推出一個新產(chǎn)品之后,性能有很大突破,它的成本幾乎讓所有研究單位都買得起。深度學(xué)習(xí)的算法,其原理是需要大量的數(shù)據(jù)采集進行自我學(xué)習(xí)??梢哉f沒有大數(shù)據(jù),就沒有深度學(xué)習(xí),也就沒有人工智能的進步。
深度學(xué)習(xí)與傳統(tǒng)計算機研究并不一樣。在以前的計算機研究方法當(dāng)中,很多是依靠科學(xué)家寫模型、寫算法。但每個人寫的程序不一樣:聰明的設(shè)計師或者程序員,如果寫的代碼比較準(zhǔn)確,模型不錯,那計算結(jié)果也會準(zhǔn)確。但如果有人水平比較有限,那么他制作出來的模型和算法也就有限,因為結(jié)果與算法有關(guān)。
傳統(tǒng)的計算方法就是靠好的專家、老師和學(xué)生,不停的培養(yǎng)、研究、優(yōu)化。深度學(xué)習(xí)則摒棄了傳統(tǒng)算法,用深度學(xué)習(xí)的神經(jīng)元網(wǎng)絡(luò)計算去訓(xùn)練計算機模型。這些模型的原始數(shù)據(jù)得益于大數(shù)據(jù)采集:數(shù)據(jù)越大,訓(xùn)練模型越準(zhǔn)確。
我們看到藍(lán)點是傳統(tǒng)專家做圖形圖象識別研究的效果。他過去花很多年,一直到四五年前,他們的頂級水平也就是 70% 左右。但是采用深度學(xué)習(xí)之后,很快提升到 90% 以上。而今天人眼的識別率是 94.5% 左右。
在真正機器訓(xùn)練之后,你會發(fā)現(xiàn)所有機器圖形圖象識別會勝過我們每一個人。機器的識別準(zhǔn)確率將遠(yuǎn)遠(yuǎn)超過人類,今天計算機的計算能力、識別能力很強大,這會讓人工智能技術(shù)有很快的發(fā)展。
比如我們今天談的汽車領(lǐng)域:自動駕駛、輔助駕駛、無人駕駛。所有這些應(yīng)用,各個不同公司有很大的突破。
但是,我們最終要達(dá)到真正的無人駕駛這種頂級水平很難。
首先得有高精地圖把路況探測準(zhǔn)確,可以定位汽車在路上哪個位置,要能看見周圍物體和障礙,最后才決定如何去駕駛。這個原理非常簡單,但是要執(zhí)行非常準(zhǔn)確是相當(dāng)困難的。
那么在這個過程當(dāng)中,我們到底如何實現(xiàn)汽車的自動駕駛?
用深度學(xué)習(xí)的方法把數(shù)據(jù)采集回來,有強大的深度學(xué)習(xí)計算機,因此我們做了 DGX-1,這個服務(wù)器的計算能力相當(dāng)于 250 個普通 CPU 服務(wù)器的計算能力,而它只是在一個小小的機箱當(dāng)中。這臺機器可以讓我們所有致力于汽車無人駕駛的研究單位,通過它可以把所有的數(shù)據(jù)放到這個深度學(xué)習(xí)系統(tǒng)當(dāng)中進行測試。
汽車終端用 DRIVE PX 實時使用,不停產(chǎn)生數(shù)據(jù),返回到服務(wù)器再訓(xùn)練再應(yīng)用。這樣它的駕駛能力和水平就會不斷提升。
如果說他采集的數(shù)據(jù)比較多,尤其是在中國,它的決策會越來越準(zhǔn)確,最后在實際使用中就會越來越準(zhǔn)確。這也是用深度學(xué)習(xí)的方式讓準(zhǔn)確率不斷提升。大概過幾年之后,汽車駕駛行為的培訓(xùn)和實際使用能力的提升,可以讓自動駕駛在實際當(dāng)中得以實現(xiàn)。
目前這當(dāng)中最重要的一環(huán)是識別汽車周邊的物體:準(zhǔn)確度很重要。 NVIDIA 自己開發(fā)了一個虛擬網(wǎng)絡(luò)叫 DRIVENET,在通常的圖形測試當(dāng)中我們的準(zhǔn)確度已經(jīng)做到第一位。
如果在不同的狀態(tài)下,比如在簡單狀態(tài)下可以做到 90% 以上,在最難的情況下可以做到 87% 以上,已經(jīng)接近于人眼識別。相信通過一系列訓(xùn)練之后,這種圖形就可以在實際當(dāng)中使用。
所有的算法會基于傳統(tǒng)的 Caffe、CNTK、KALDI 幫助我們做訓(xùn)練。在實測過程中,它可以在路況當(dāng)中把所有信息都捕捉回來,計算機可以通過程序來判斷駕駛行為。
其中高精地圖是最重要的,如果不是高精地圖,那么采集回來的數(shù)據(jù)就會有偏差。我們和很多地圖公司合作,把他們的地圖變成高精地圖。當(dāng)然有一些國家的高精地圖應(yīng)用需要政府的批準(zhǔn)才可以去采集高精地圖,否則不能用于民用。
在中國,因為政府對汽車自動駕駛非常支持,所以我們已經(jīng)有很多公司拿到執(zhí)照并采集高精地圖。像 HERE、TOMTOM、ZENRIN 采集的地圖都可以結(jié)合到 NVIDIA 的虛擬網(wǎng)絡(luò)幫助他們進行訓(xùn)練。
如果說依靠高精地圖、定位、識別汽車的周圍狀況,直接進行汽車自動駕駛,這是我們傳統(tǒng)的思路。NVIDIA 要打破這些傳統(tǒng)思路,我們在想一種方法,怎么能去學(xué)習(xí)人的駕駛。
每個人在開車的時候,看到的只是前面的前擋玻璃和反光鏡、后視鏡。那么汽車是不是看到這些圖象就可以做自動駕駛?
我們做一個網(wǎng)絡(luò)就是模擬真正駕駛員的行為。而決定駕駛行為,就是方向盤怎么打,油門、剎車怎么踩,這些是簡單的數(shù)據(jù)。在不同的車況和速度之下,駕駛行為的決策就會有大數(shù)據(jù)訓(xùn)練模型。
給大家看一個簡單的視頻:這輛汽車一開始不知道如何駕駛,會犯很多錯誤。駕駛員在行駛了 3000 公里之后,這輛汽車學(xué)會了如何駕駛、如何順利安全到達(dá)目的地。
雖然它已經(jīng)可以上路,但離實際使用還差很遠(yuǎn)。我們可以看到一個新方法:它并不復(fù)雜,沒有地圖,不知道前方發(fā)生了什么,只是看有什么樣的圖象之后,車輛模擬駕駛員操作的油門、剎車、方向盤。因此深度學(xué)習(xí)完全可以采用一種全新方法去做自動駕駛。
我們希望這個方法能給其他研究單位新的啟發(fā),來挑戰(zhàn)我們傳統(tǒng)的計算模式,用新的計算方式建造新的人工智能系統(tǒng)。我們完全可以想像,在深度學(xué)習(xí)之后,大學(xué)當(dāng)中學(xué)的每一個計算模型都會受到挑戰(zhàn),每一個模型都可以用全新的數(shù)據(jù)方法建立新的人工智能系統(tǒng),去取代任何自己花了幾十年的研究成果建立的模型。
所有的人工智能,無論是做語言還是語音、圖象、搜索,都和 GPU 相關(guān)。所有傳統(tǒng)行業(yè)都會利用深度學(xué)習(xí)去推動新的改革,讓新的研究方向達(dá)到一個新高度和新的飛躍。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。