4
今年8月,雷鋒網(wǎng)將在深圳舉辦盛況空前的“全球人工智能與機(jī)器人峰會(huì)”,屆時(shí)雷鋒網(wǎng)將發(fā)布“人工智能&機(jī)器人Top25創(chuàng)新企業(yè)榜”榜單。目前,我們正在逐一拜訪人工智能、機(jī)器人領(lǐng)域的相關(guān)公司,從中篩選最終入選榜單的公司名單。如果你也想加入我們的榜單之中,請(qǐng)聯(lián)系:2020@leiphone.com。
每年,斯坦福都會(huì)舉辦一個(gè)比賽,叫作ImageNet視覺(jué)識(shí)別挑戰(zhàn)……
這個(gè)比賽的參與者不是學(xué)生團(tuán)隊(duì),而是全球的科技巨頭,比如谷歌呀、微軟呀、百度啊啥的。
怎么比呢,簡(jiǎn)單說(shuō)來(lái),ImageNet相當(dāng)于一個(gè)算法考場(chǎng),而大公司就可以利用它家的龐大題庫(kù)進(jìn)行考試,正確率越高,當(dāng)然就是本場(chǎng)比賽的冠軍了。
順嘴一說(shuō),去年六月的時(shí)候,百度因涉嫌在測(cè)試過(guò)程中作弊,而被ImageNet組織方禁賽一年了。
而很多人打死都不會(huì)想到,這個(gè)“引無(wú)數(shù)英雄競(jìng)折腰”的ImageNet,背后的“終極考官”竟然是個(gè)大美女!還是個(gè)華人美女!
她就是李飛飛,一個(gè)集才華與美貌于一身的女子。
出生在北京的李飛飛,16歲隨父母移居美國(guó)?;蛟S對(duì)科學(xué)的愛(ài)就是這樣不分性別,李飛飛在1999年以最高榮譽(yù)獲普林斯頓大學(xué)物理學(xué)學(xué)士學(xué)位,輔修工程物理專(zhuān)業(yè)。
隨后,她在加州理工攻讀電子工程的碩博學(xué)位,并在2005年順利畢業(yè)。她的研究興趣主要集中在視覺(jué)研究領(lǐng)域,包括計(jì)算機(jī)視覺(jué)和視覺(jué)心理學(xué),例如物體識(shí)別、場(chǎng)景分類(lèi)和事件分類(lèi)等。
2009年,李飛飛來(lái)到了斯坦福,僅僅三年,李飛飛就晉升為終身教授,并成為斯坦福大學(xué)人工智能實(shí)驗(yàn)室(SAIL)及斯坦福大學(xué)視覺(jué)實(shí)驗(yàn)室的主管。
在李飛飛2014年的簡(jiǎn)歷上,有95篇在Nature、PNAS、Journal of Neuroscience、CVPR、ICCV、NIPS等頂級(jí)期刊與會(huì)議上發(fā)表的文章;聯(lián)合發(fā)表文章32篇。
懷疑論文太水?Na?ve。隨便列舉幾個(gè)李飛飛獲得的獎(jiǎng)項(xiàng)吧:
2006年微軟學(xué)者新星獎(jiǎng)以及谷歌研究獎(jiǎng)
2009年NSF杰出青年獎(jiǎng)
2011年美國(guó)斯隆學(xué)者獎(jiǎng)
2012年雅虎實(shí)驗(yàn)室學(xué)者獎(jiǎng)
2014年IBM學(xué)者獎(jiǎng)
不過(guò)比起那些只埋頭工作的學(xué)者,李飛飛靠著自己的顏值才華參加了不少演講,在她19頁(yè)的簡(jiǎn)歷里,有四頁(yè)是關(guān)于參加過(guò)的各種演講。她和媒體的關(guān)系也一直不錯(cuò),上過(guò)New York Times和TED。
“明明可以靠臉吃飯,卻偏要拼才華”,李飛飛就是這句話的最佳代言人……而現(xiàn)在,她又搖身一變,成為了谷歌微軟等一眾科技公司在圖像識(shí)別的終極考官。
作為全球計(jì)算機(jī)視覺(jué)領(lǐng)域的知名專(zhuān)家,李飛飛的主要貢獻(xiàn)在于參與建立了兩個(gè)被AI研究者廣泛使用來(lái)教機(jī)器分類(lèi)物體的數(shù)據(jù)庫(kù):Caltech 101和ImageNet,而后者,目前已經(jīng)成為了全球最大的圖像識(shí)別數(shù)據(jù)庫(kù)。
如果說(shuō)李飛飛是圖像識(shí)別的大考官,那么她一手創(chuàng)建的ImageNet就是科技公司在圖像識(shí)別的考場(chǎng)。
為什么不從算法上優(yōu)化機(jī)器的“眼睛”,而是從“大腦”入手?
以往,計(jì)算機(jī)識(shí)別的邏輯是:
教計(jì)算機(jī)看到“對(duì)象”。研究者將訓(xùn)練圖片抽象成一些模型,并借算法告訴計(jì)算機(jī):
“有著圓臉、胖身子、 兩個(gè)尖尖的耳朵,還有一條長(zhǎng)尾巴的東西,就是貓?!?/p>
然而,如果小貓是以這種形態(tài)存在的呢?(笑)
雖然一個(gè)3歲小孩都可以輕易地判斷,這也是一只貓,但計(jì)算機(jī)就已經(jīng)蒙圈了:它并不符合“貓”所代表的模型特征。
這就陷入了一個(gè)難題:即使是再常見(jiàn)的寵物,都可能呈現(xiàn)出多變的形態(tài),只通過(guò)歸納模型來(lái)做機(jī)器識(shí)別,是不科學(xué)也不現(xiàn)實(shí)的。
所以,以ImageNet為代表的圖像識(shí)別數(shù)據(jù)庫(kù)提供了一種更接近人類(lèi)識(shí)別物體過(guò)程的方式:
沒(méi)有人教嬰兒怎么看,但他們?cè)?歲的時(shí)候就能認(rèn)得很多東西,這是因?yàn)槿耸菑恼鎸?shí)世界中汲取經(jīng)驗(yàn)的。
“如果你把孩子的眼睛都看作是生物照相機(jī), 那他們每200毫秒就拍一張照。 ——這是眼球轉(zhuǎn)動(dòng)一次的平均時(shí)間。 所以到3歲大的時(shí)候,一個(gè)孩子已經(jīng)看過(guò)了上億張的真實(shí)世界照片。 這種‘訓(xùn)練照片’的數(shù)量是非常大的?!?/p>
利用互聯(lián)網(wǎng),ImageNet提供了一個(gè)龐大的圖片數(shù)據(jù)庫(kù),讓計(jì)算機(jī)系統(tǒng)能夠在1500萬(wàn)張照片里認(rèn)識(shí)22000種物品。
而教會(huì)了計(jì)算機(jī)看東西還只是第一步,我們還需要算法的力量!
作為和大腦神經(jīng)原理類(lèi)似的卷積神經(jīng)網(wǎng)絡(luò),用ImageNet來(lái)訓(xùn)練實(shí)在是再合適不過(guò)了。卷積神經(jīng)網(wǎng)絡(luò),最早由Kunihiko Fukushima,Geoff Hinton, 和Yann LeCun三人在上世紀(jì)七八十年代開(kāi)創(chuàng)。
就像神經(jīng)的最小運(yùn)算單元是神經(jīng)元一樣,神經(jīng)網(wǎng)絡(luò)的最小單位也是一個(gè)小節(jié)點(diǎn)。節(jié)點(diǎn)通過(guò)連結(jié)不同的結(jié)點(diǎn),能夠輸入輸出信息,實(shí)現(xiàn)“思考”。如果將一張圖片以不同維度分為各種層次,每個(gè)層次用來(lái)識(shí)別不同的內(nèi)容,比如花色、顏色、形狀等等。
想象一下,如果有30種不同的維度進(jìn)行過(guò)濾和篩選……準(zhǔn)確度是不是有著令人驚訝的提高?
在一個(gè)用來(lái)訓(xùn)練對(duì)象識(shí)別模型的典型神經(jīng)網(wǎng)絡(luò)中,有著2400萬(wàn)個(gè)節(jié)點(diǎn),1.4億個(gè)參數(shù),及150億個(gè)聯(lián)結(jié)。借助ImageNet提供的巨大規(guī)模數(shù)據(jù)支持,研究者可以通過(guò)大量最先進(jìn)的CPU和GPU,來(lái)訓(xùn)練這些模型。這兩者相輔相成,在對(duì)象識(shí)別領(lǐng)域發(fā)展成為一個(gè)成功的體系。
通過(guò)讓計(jì)算機(jī)讀出谷歌街景,實(shí)際上能得到很多有意思的結(jié)果。比如道路上的汽車(chē)價(jià)格與家庭收入,甚至是和犯罪率的關(guān)系。
然而計(jì)算機(jī)能讀懂了圖片,這一切就到此為止了嗎?
當(dāng)然不。在大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法的合力協(xié)作下,我們可以讓計(jì)算機(jī)這個(gè)剛剛認(rèn)識(shí)一些事物的baby慢慢組織語(yǔ)言,并用完整的句子表達(dá)出來(lái)——就像一個(gè)真正的小孩一樣。
雖然有時(shí)候會(huì)鬧一些笑話……
雖然計(jì)算機(jī)目前還不能像人一樣,在看到圖片的一瞬就能理解它想要表達(dá)的情緒,還有各種事物背后所隱含和傳遞的訊息……
但,它已經(jīng)在努力了不是嗎。
更何況,還有那么多以“考官”李飛飛為代表的,一直在為圖像識(shí)別而努力的研究者們。他們或作為出卷人殫精竭慮,收集不同的圖片而完善算法的精度;或作為應(yīng)試者,忐忑不安地讓計(jì)算機(jī)接受系統(tǒng)的“考驗(yàn)“;但不論作為哪一方,他們都朝著同樣的方向,都在努力讓計(jì)算機(jī)能獲得更好的“成績(jī)”。
或許,終極考官李飛飛面臨的是這樣的境地:一方面,她希望ImageNet考場(chǎng)里的“試題”能難倒前來(lái)應(yīng)試的計(jì)算機(jī)們,因?yàn)檫@說(shuō)明算法的突破口就在這里;而另一方面,如果計(jì)算機(jī)成功答出了試題,說(shuō)明圖像識(shí)別的技術(shù)又進(jìn)步了一分。哪怕是攻克了一道“難題”,正確描述出了某張圖片上的內(nèi)容,都值得雙方歡呼雀躍;而這樣甜蜜的煩惱,也是考官李飛飛所享受的。
而最最重要的是,ImageNet——這個(gè)集合了全球智慧和力量的數(shù)據(jù)庫(kù)——是免費(fèi)的。這也就意味著,全球所有致力于圖像識(shí)別的公司,都可以免費(fèi)對(duì)自己的算法進(jìn)行反復(fù)測(cè)試。這就好像一個(gè)龐大的試題庫(kù),只要愿意,任何公司都可以一直接受考官的檢驗(yàn)。
雖然GAIR大會(huì)因?yàn)楦鞣N經(jīng)費(fèi)的限制無(wú)法做到完全免費(fèi),但是已經(jīng)盡我們所能,為大家提供了六折的優(yōu)惠——1212元,7月1日截止?;蛟S在8月12日的GAIR現(xiàn)場(chǎng),你可以有機(jī)會(huì)和這位美麗的研究者探討圖像識(shí)別的最新進(jìn)展呢。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。