丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
專欄 正文
發(fā)私信給董飛
發(fā)送

4

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

本文作者: 董飛 2016-04-16 17:40
導(dǎo)語:冷冰冰的機(jī)器是如何像人一樣去理解那些藏在照片背后的故事?ImageNet締造者李飛飛帶來了有趣的講述。

【編者按】本文作者董飛,微信公眾號(hào):董老師在硅谷

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

斯坦福大學(xué)每年都會(huì)舉行一個(gè)比賽,邀請(qǐng)谷歌、微軟、百度等IT企業(yè)使用ImageNet——全球最大的圖像識(shí)別數(shù)據(jù)庫(kù),測(cè)試他們的系統(tǒng)運(yùn)行情況。每年一度的比賽也牽動(dòng)著各大巨頭公司的心弦,過去幾年中,系統(tǒng)的圖像識(shí)別功能大大提高,出錯(cuò)率僅為約5%(比人眼還低)。它的締造者就是斯坦福大學(xué)的李飛飛教授,下一步就是圖像理解,她開啟了Visual Genome(視覺基因組)計(jì)劃,要把語義和圖像結(jié)合起來,推動(dòng)人工智能的進(jìn)一步發(fā)展。原文來自TED講座。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

背景

李飛飛生于北京,16歲隨父母移居美國(guó)。 現(xiàn)為斯坦福大學(xué)計(jì)算機(jī)系終身教授,人工智能實(shí)驗(yàn)室與視覺實(shí)驗(yàn)室主任。主要研究方向?yàn)闄C(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、認(rèn)知計(jì)算神經(jīng)學(xué),側(cè)重大數(shù)據(jù)分析為主,已在Nature、PNAS、Journal of Neuroscience、CVPR、ICCV、NIPS等頂級(jí)期刊與會(huì)議上發(fā)表了100余篇學(xué)術(shù)論文。她于1999年以最高榮譽(yù)獲普林斯頓大學(xué)本科學(xué)位,并于2005年獲加州理工學(xué)院電子工程博士學(xué)位。曾獲2006年微軟學(xué)者新星獎(jiǎng)以及谷歌研究獎(jiǎng)、2009年NSF杰出青年獎(jiǎng)、2011年美國(guó)斯隆學(xué)者獎(jiǎng)、2012年雅虎實(shí)驗(yàn)室學(xué)者獎(jiǎng)以及2014年IBM學(xué)者獎(jiǎng)。她還是TED 2015大會(huì)演講嘉賓。

她是世界上頂尖的計(jì)算機(jī)視覺專家之一。她參與建立了兩個(gè)被AI研究者廣泛使用來教機(jī)器分類物體的數(shù)據(jù)庫(kù):Caltech 101和ImageNet。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

她想要打造出一種看得見東西、幫助我們改善生活的機(jī)器。過去15年中,李飛飛一直在教計(jì)算機(jī)看東西。從一個(gè)博士生成長(zhǎng)為斯坦福大學(xué)計(jì)算機(jī)視覺實(shí)驗(yàn)室主任,李飛飛不遺余力地朝著困難重重的目標(biāo)邁進(jìn)。她希望創(chuàng)造出一種電子眼,能讓機(jī)器人和機(jī)器看懂世界,更重要的是,能夠了解自己所處的環(huán)境。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

在一場(chǎng)被觀看了120多萬次的TED演講(如下方視頻)中她說:「我總在想著里奧和他將生活的未來世界。」在她心中最理想的未來中,機(jī)器可以看見世界,但目的并不是為了效率最大化,而是為了共情

以下是李飛飛TED演講:如何教計(jì)算機(jī)理解圖片

下面就來自她這次TED演講稿

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

這是一個(gè)三歲小孩在講述她從一系列照片里看到的東西。

對(duì)這個(gè)世界, 她也許還有很多要學(xué)的東西, 但在一個(gè)重要的任務(wù)上, 她已經(jīng)是專家了: 去理解她所看到的東西。我們的社會(huì)已經(jīng)在科技上取得了前所未有的進(jìn)步。 我們把人送上月球, 我們制造出可以與我們對(duì)話的手機(jī), 或者訂制一個(gè)音樂電臺(tái), 播放的全是我們喜歡的音樂。 然而,哪怕是我們最先進(jìn)的機(jī)器和電腦也會(huì)在這個(gè)問題上犯難。 所以今天我在這里, 向大家做個(gè)進(jìn)度匯報(bào): 關(guān)于我們?cè)谟?jì)算機(jī)視覺方面最新的研究進(jìn)展。 這是計(jì)算機(jī)科學(xué)領(lǐng)域最前沿的、 具有革命性潛力的科技。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

是的,我們現(xiàn)在已經(jīng)有了具備自動(dòng)駕駛功能的原型車, 但是如果沒有敏銳的視覺, 它們就不能真正區(qū)分出地上擺著的是一個(gè)壓扁的紙袋, 可以被輕易壓過, 還是一塊相同體積的石頭, 應(yīng)該避開。我們已經(jīng)造出了超高清的相機(jī), 但我們?nèi)匀粺o法把這些畫面?zhèn)鬟f給盲人。 我們的無人機(jī)可以飛躍廣闊的土地, 卻沒有足夠的視覺技術(shù)去幫我們追蹤熱帶雨林的變化。 安全攝像頭到處都是, 但當(dāng)有孩子在泳池里溺水時(shí)它們無法向我們報(bào)警。 照片和視頻,已經(jīng)成為全人類生活里不可缺少的部分。 它們以極快的速度被創(chuàng)造出來, 以至于沒有任何人,或者團(tuán)體, 能夠完全瀏覽這些內(nèi)容, 而你我正參與其中的這場(chǎng)TED, 也為之添磚加瓦。 

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

直到現(xiàn)在,我們最先進(jìn)的軟件也依然為之犯難: 該怎么理解和處理這些數(shù)量龐大的內(nèi)容? 所以換句話說, 在作為集體的這個(gè)社會(huì)里, 我們依然非常茫然,因?yàn)槲覀冏钪悄艿臋C(jī)器依然有視覺上的缺陷。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

 ”為什么這么困難?“你也許會(huì)問。 照相機(jī)可以像這樣獲得照片: 它把采集到的光線轉(zhuǎn)換成二維數(shù)字矩陣來存儲(chǔ) ——也就是“像素”, 但這些仍然是死板的數(shù)字。 它們自身并不攜帶任何意義。 就像”聽到“和“聽”完全不同, ”拍照“和”看“也完全不同。 通過“看”, 我們實(shí)際上是“理解”了這個(gè)畫面。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

事實(shí)上,大自然經(jīng)過了5億4千萬年的努力才完成了這個(gè)工作, 而這努力中更多的部分是用在進(jìn)化我們的大腦內(nèi)用于視覺處理的器官, 而不是眼睛本身。 

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

所以"視覺”從眼睛采集信息開始, 但大腦才是它真正呈現(xiàn)意義的地方。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

15年來, 從我進(jìn)入加州理工學(xué)院攻讀Ph.D到后來領(lǐng)導(dǎo)斯坦福大學(xué)的視覺實(shí)驗(yàn)室, 我一直在和我的導(dǎo)師、 合作者和學(xué)生們一起教計(jì)算機(jī)如何去“看”。 我們的研究領(lǐng)域叫做 "計(jì)算機(jī)視覺與機(jī)器學(xué)習(xí)"。 這是AI(人工智能)領(lǐng)域的一個(gè)分支。 

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

最終,我們希望能教會(huì)機(jī)器像我們一樣看見事物: 識(shí)別物品、辨別不同的人、 推斷物體的立體形狀、 理解事物的關(guān)聯(lián)、 人的情緒、動(dòng)作和意圖。 像你我一樣,只凝視一個(gè)畫面一眼就能理清整個(gè)故事中的人物、地點(diǎn)、事件。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

實(shí)現(xiàn)這一目標(biāo)的第一步是教計(jì)算機(jī)看到“對(duì)象”(物品), 這是建造視覺世界的基石。 在這個(gè)最簡(jiǎn)單的任務(wù)里, 想象一下這個(gè)教學(xué)過程: 給計(jì)算機(jī)看一些特定物品的訓(xùn)練圖片, 比如說貓, 并讓它從這些訓(xùn)練圖片中, 學(xué)習(xí)建立出一個(gè)模型來。 這有多難呢? 

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

不管怎么說,一只貓只是一些形狀和顏色拼湊起來的圖案罷了, 比如這個(gè)就是我們最初設(shè)計(jì)的抽象模型。 我們用數(shù)學(xué)的語言, 告訴計(jì)算機(jī)這種算法: “貓”有著圓臉、胖身子、 兩個(gè)尖尖的耳朵,還有一條長(zhǎng)尾巴, 這算法看上去挺好的。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

但如果遇到這樣的貓呢?  它整個(gè)蜷縮起來了。 現(xiàn)在你不得不加入一些別的形狀和視角來描述這個(gè)物品模型。 

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

但如果貓是藏起來的呢? 再看看這些傻貓呢? 你現(xiàn)在知道了吧。 即使那些事物簡(jiǎn)單到只是一只家養(yǎng)的寵物, 都可以呈現(xiàn)出無限種變化的外觀模型, 而這還只是“一個(gè)”對(duì)象的模型。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

大概在8年前, 一個(gè)非常簡(jiǎn)單、有沖擊力的觀察改變了我的想法。 沒有人教過嬰兒怎么“看”, 尤其是在他們還很小的時(shí)候。 他們是從真實(shí)世界的經(jīng)驗(yàn)和例子中學(xué)到這個(gè)的。 如果你把孩子的眼睛都看作是生物照相機(jī), 那他們每200毫秒就拍一張照。 ——這是眼球轉(zhuǎn)動(dòng)一次的平均時(shí)間。 所以到3歲大的時(shí)候,一個(gè)孩子已經(jīng)看過了上億張的真實(shí)世界照片。 這種“訓(xùn)練照片”的數(shù)量是非常大的。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

所以,與其孤立地關(guān)注于算法的優(yōu)化、再優(yōu)化, 我的關(guān)注點(diǎn)放在了給算法提供像那樣的訓(xùn)練數(shù)據(jù)——那些嬰兒們從經(jīng)驗(yàn)中獲得的質(zhì)量和數(shù)量都極其驚人的訓(xùn)練照片。

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

一旦我們知道了這個(gè), 我們就明白自己需要收集的數(shù)據(jù)集, 必須比我們?cè)羞^的任何數(shù)據(jù)庫(kù)都豐富——可能要豐富數(shù)千倍。 因此,通過與普林斯頓大學(xué)的Kai Li教授合作, 我們?cè)?007年發(fā)起了ImageNet(圖片網(wǎng)絡(luò))計(jì)劃。 幸運(yùn)的是,我們不必在自己腦子里裝上一臺(tái)照相機(jī),然后等它拍很多年。 我們運(yùn)用了互聯(lián)網(wǎng), 這個(gè)由人類創(chuàng)造的最大的圖片寶庫(kù)。 

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

我們下載了接近10億張圖片并利用眾包技術(shù)(利用互聯(lián)網(wǎng)分配工作、發(fā)現(xiàn)創(chuàng)意或解決技術(shù)問題),像亞馬遜(Amazon)土耳其機(jī)器人(Mechanical Turk)這樣的平臺(tái)來幫我們標(biāo)記這些圖片。 在高峰期時(shí),ImageNet是「亞馬遜土耳其機(jī)器人」這個(gè)平臺(tái)上最大的雇主之一。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

來自世界上167個(gè)國(guó)家的接近5萬個(gè)工作者,在一起工作幫我們篩選、排序、標(biāo)記了接近10億張備選照片。 這就是我們?yōu)檫@個(gè)計(jì)劃投入的精力, 去捕捉一個(gè)嬰兒可能在他早期發(fā)育階段獲取的”一小部分“圖像。他們幫忙給數(shù)百萬張貓、飛機(jī)和人的隨機(jī)圖像貼標(biāo)簽。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

現(xiàn)在回頭看,用大數(shù)據(jù)來訓(xùn)練計(jì)算機(jī)算法的做法或許顯而易見。但是在2007年,這并不顯然。在這段旅途中,我很長(zhǎng)一段時(shí)間都非常孤獨(dú),有些同事友情建議我做些對(duì)獲得終身教職更有用的事。我們?cè)谘芯拷?jīng)費(fèi)方面也一直碰到麻煩,我可能需要重開我的干洗店來為ImageNet籌資。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

我們?nèi)匀辉诶^續(xù)著。 在2009年,ImageNet項(xiàng)目誕生了—— 一個(gè)含有1500萬張照片的數(shù)據(jù)庫(kù), 涵蓋了22000種物品。 這些物品是根據(jù)日常英語單詞進(jìn)行分類組織的。 無論是在質(zhì)量上還是數(shù)量上, 這都是一個(gè)規(guī)??涨暗臄?shù)據(jù)庫(kù)。 

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

舉個(gè)例子,在"貓"這個(gè)對(duì)象中, 我們有超過62000只貓長(zhǎng)相各異,姿勢(shì)五花八門, 而且涵蓋了各種品種的家貓和野貓。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

我們對(duì)ImageNet收集到的圖片感到異常興奮, 而且我們希望整個(gè)研究界能從中受益, 所以以一種和TED一樣的方式, 我們公開了整個(gè)數(shù)據(jù)庫(kù), 免費(fèi)提供給全世界的研究團(tuán)體。 

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

那么現(xiàn)在,我們有了用來培育計(jì)算機(jī)大腦的數(shù)據(jù)庫(kù), 我們可以回到”算法“本身上來了。 因?yàn)镮mageNet的橫空出世,它提供的信息財(cái)富完美地適用于一些特定類別的機(jī)器學(xué)習(xí)算法。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

“卷積神經(jīng)網(wǎng)絡(luò)”, 最早由Kunihiko Fukushima,Geoff Hinton, 和Yann LeCun在上世紀(jì)七八十年代開創(chuàng)。 

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

就像大腦是由上十億的緊密聯(lián)結(jié)的神經(jīng)元組成, 神經(jīng)網(wǎng)絡(luò)里最基礎(chǔ)的運(yùn)算單元也是一個(gè)“神經(jīng)元式”的節(jié)點(diǎn)。 每個(gè)節(jié)點(diǎn)從其它節(jié)點(diǎn)處獲取輸入信息, 然后把自己的輸出信息再交給另外的節(jié)點(diǎn)。 

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

此外,這些成千上萬、甚至上百萬的節(jié)點(diǎn)都被按等級(jí)分布于不同層次, 就像大腦一樣。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

在一個(gè)我們用來訓(xùn)練“對(duì)象識(shí)別模型”的典型神經(jīng)網(wǎng)絡(luò)里, 有著2400萬個(gè)節(jié)點(diǎn),1億4千萬個(gè)參數(shù), 和150億個(gè)聯(lián)結(jié)。 這是一個(gè)龐大的模型。 借助ImageNet提供的巨大規(guī)模數(shù)據(jù)支持, 通過大量最先進(jìn)的CPU和GPU, 來訓(xùn)練這些堆積如山的模型, “卷積神經(jīng)網(wǎng)絡(luò)” 以難以想象的方式蓬勃發(fā)展起來。 它成為了一個(gè)成功體系, 在對(duì)象識(shí)別領(lǐng)域, 產(chǎn)生了激動(dòng)人心的新成果。 

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

神經(jīng)網(wǎng)絡(luò)用于解讀圖片,包括一些分層排列的人工神經(jīng)元,神經(jīng)元數(shù)量從幾十到幾百、幾千,甚至上百萬不等。每層神經(jīng)元負(fù)責(zé)識(shí)別圖像的不同成分,有的識(shí)別像素,有的識(shí)別顏色差異,還有的識(shí)別形狀。到頂層時(shí)——如今的神經(jīng)網(wǎng)絡(luò)可以容納多達(dá)30層——計(jì)算機(jī)就能對(duì)圖像識(shí)別出個(gè)大概了。

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

上面幾張圖是計(jì)算機(jī)在告訴我們: 照片里有一只貓、 還有貓所在的位置。 當(dāng)然不止有貓了, 這是計(jì)算機(jī)算法在告訴我們照片里有一個(gè)男孩,和一個(gè)泰迪熊; 一只狗,一個(gè)人,和背景里的小風(fēng)箏; 或者是一張拍攝于鬧市的照片比如人、滑板、欄桿、燈柱等等。 

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

有時(shí)候,如果計(jì)算機(jī)不是很確定它看到的是什么, 我們還教它用足夠聰明的方式給出一個(gè)“安全”的答案,而不是“言多必失“——就像人類面對(duì)這類問題時(shí)一樣。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

但在其他時(shí)候,我們的計(jì)算機(jī)算法厲害到可以告訴我們關(guān)于對(duì)象的更確切的信息, 比如汽車的品牌、型號(hào)、年份。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

我們?cè)谏习偃f張谷歌街景照片中應(yīng)用了這一算法, 那些照片涵蓋了上百個(gè)美國(guó)城市。 我們從中發(fā)現(xiàn)一些有趣的事: 首先,它證實(shí)了我們的一些常識(shí): 汽車的價(jià)格,與家庭收入呈現(xiàn)出明顯的正相關(guān)。 但令人驚奇的是,汽車價(jià)格與犯罪率也呈現(xiàn)出明顯的正相關(guān)性, 以上結(jié)論是基于城市、或投票的郵編區(qū)域進(jìn)行分析的結(jié)果。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

那么等一下,這就是全部成果了嗎? 計(jì)算機(jī)是不是已經(jīng)達(dá)到, 或者甚至超過了人類的能力? ——還沒有那么快。 目前為止,我們還只是教會(huì)了計(jì)算機(jī)去看對(duì)象。 這就像是一個(gè)小寶寶學(xué)會(huì)說出幾個(gè)名詞。 這是一項(xiàng)難以置信的成就, 但這還只是第一步。 很快,我們就會(huì)到達(dá)發(fā)展歷程的另一個(gè)里程碑: 這個(gè)小孩會(huì)開始用“句子”進(jìn)行交流。 所以不止是說這張圖里有只“貓”, 你在開頭已經(jīng)聽到小妹妹告訴我們“這只貓是坐在床上的”。

為了教計(jì)算機(jī)看懂圖片并生成句子, “大數(shù)據(jù)”和“機(jī)器學(xué)習(xí)算法”的結(jié)合需要更進(jìn)一步。 現(xiàn)在,計(jì)算機(jī)需要從圖片和人類創(chuàng)造的自然語言句子中同時(shí)進(jìn)行學(xué)習(xí)。

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

就像我們的大腦, 把視覺現(xiàn)象和語言融合在一起, 我們開發(fā)了一個(gè)模型, 可以把一部分視覺信息,像視覺片段與語句中的文字、短語聯(lián)系起來。

大約4個(gè)月前, 我們最終把所有技術(shù)結(jié)合在了一起, 創(chuàng)造了第一個(gè)“計(jì)算機(jī)視覺模型”, 它在看到圖片的第一時(shí)間,就有能力生成類似人類語言的句子。 現(xiàn)在,我準(zhǔn)備給你們看看計(jì)算機(jī)看到圖片時(shí)會(huì)說些什么——還是那些在演講開頭給小女孩看的圖片。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī): “一個(gè)男人站在一頭大象旁邊?!?/p>

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī)還是會(huì)犯很多錯(cuò)誤的。比如: “一只貓?zhí)稍诖采系奶鹤由??!碑?dāng)然——如果它看過太多種的貓, 它就會(huì)覺得什么東西都長(zhǎng)得像貓……

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī): “一個(gè)小男孩拿著一根棒球棍?!?nbsp;或者…如果它從沒見過牙刷, 它就分不清牙刷和棒球棍的區(qū)別。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī): “建筑旁的街道上有一個(gè)男人騎馬經(jīng)過?!?nbsp;我們還沒教它Art101(美國(guó)大學(xué)藝術(shù)基礎(chǔ)課)

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī): “一只斑馬站在一片草原上?!?nbsp;它還沒學(xué)會(huì)像你我一樣欣賞大自然里的絕美景色。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

所以,這是一條漫長(zhǎng)的道路。 將一個(gè)孩子從出生培養(yǎng)到3歲是很辛苦的。 而真正的挑戰(zhàn)是從3歲到13歲的過程中, 而且遠(yuǎn)遠(yuǎn)不止于此。 讓我再給你們看看這張關(guān)于小男孩和蛋糕的圖。 目前為止, 我們已經(jīng)教會(huì)計(jì)算機(jī)“看”對(duì)象, 或者甚至基于圖片, 告訴我們一個(gè)簡(jiǎn)單的故事。計(jì)算機(jī): ”一個(gè)人坐在放蛋糕的桌子旁?!?/p>

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

而坐在桌子旁邊的人,這個(gè)年幼的男孩就是李飛飛的兒子,里奧。

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

但圖片里還有更多信息 ——遠(yuǎn)不止一個(gè)人和一個(gè)蛋糕。 計(jì)算機(jī)無法理解的是: 這是一個(gè)特殊的意大利蛋糕, 它只在復(fù)活節(jié)限時(shí)供應(yīng)。 而這個(gè)男孩穿著的是他最喜歡的T恤衫, 那是他父親去悉尼旅行時(shí)帶給他的禮物。 另外,你和我都能清楚地看出, 這個(gè)小孩有多高興,以及這一刻在想什么。

電腦或許能用簡(jiǎn)單的語言來描述它所「看見」的圖片,但它卻無法描述照片背后的故事。

后邊這一段話也鼓舞人心,這個(gè)世界的另一端有一部分人在孜孜不倦為視覺領(lǐng)域的進(jìn)步不斷努力。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

在我探索視覺智能的道路上, 我不斷地想到Leo和他未來將要生活的那個(gè)世界。 當(dāng)機(jī)器可以“看到”的時(shí)候, 醫(yī)生和護(hù)士會(huì)獲得一雙額外的、 不知疲倦的眼睛, 幫他們?cè)\斷病情、照顧病人。 汽車可以在道路上行駛得更智能、更安全。 機(jī)器人,而不只是人類, 會(huì)幫我們救助災(zāi)區(qū)被困和受傷的人員。 我們會(huì)發(fā)現(xiàn)新的物種、更好的材料, 還可以在機(jī)器的幫助下探索從未見到過的前沿地帶。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

 ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

一點(diǎn)一點(diǎn)地, 我們正在賦予機(jī)器以視力。 首先,我們教它們?nèi)ァ翱础薄?然后,它們反過來也幫助我們, 讓我們看得更清楚。 這是第一次,人類的眼睛不再獨(dú)自地思考和探索我們的世界。 我們將不止是“使用”機(jī)器的智力, 我們還要以一種從未想象過的方式, 與它們“合作”。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

我所追求的是: 賦予計(jì)算機(jī)視覺智能, 并為L(zhǎng)eo和這個(gè)世界, 創(chuàng)造出更美好的未來。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

也許這就是科學(xué)家的理想和情懷吧。

雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

ImageNet締造者:讓冰冷的機(jī)器讀懂照片背后的故事

分享:
相關(guān)文章

專欄作者

關(guān)注硅谷,關(guān)注高科技
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說