ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

本文作者：董飛

2016-04-16 17:40

導(dǎo)語：冷冰冰的機(jī)器是如何像人一樣去理解那些藏在照片背后的故事？ImageNet締造者李飛飛帶來了有趣的講述。

【編者按】本文作者董飛，微信公眾號(hào)：董老師在硅谷

斯坦福大學(xué)每年都會(huì)舉行一個(gè)比賽，邀請(qǐng)谷歌、微軟、百度等IT企業(yè)使用ImageNet——全球最大的圖像識(shí)別數(shù)據(jù)庫，測(cè)試他們的系統(tǒng)運(yùn)行情況。每年一度的比賽也牽動(dòng)著各大巨頭公司的心弦，過去幾年中，系統(tǒng)的圖像識(shí)別功能大大提高，出錯(cuò)率僅為約5％（比人眼還低）。它的締造者就是斯坦福大學(xué)的李飛飛教授，下一步就是圖像理解，她開啟了Visual Genome（視覺基因組）計(jì)劃，要把語義和圖像結(jié)合起來，推動(dòng)人工智能的進(jìn)一步發(fā)展。原文來自TED講座。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

背景

李飛飛生于北京，16歲隨父母移居美國。現(xiàn)為斯坦福大學(xué)計(jì)算機(jī)系終身教授，人工智能實(shí)驗(yàn)室與視覺實(shí)驗(yàn)室主任。主要研究方向?yàn)闄C(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、認(rèn)知計(jì)算神經(jīng)學(xué)，側(cè)重大數(shù)據(jù)分析為主，已在Nature、PNAS、Journal of Neuroscience、CVPR、ICCV、NIPS等頂級(jí)期刊與會(huì)議上發(fā)表了100余篇學(xué)術(shù)論文。她于1999年以最高榮譽(yù)獲普林斯頓大學(xué)本科學(xué)位，并于2005年獲加州理工學(xué)院電子工程博士學(xué)位。曾獲2006年微軟學(xué)者新星獎(jiǎng)以及谷歌研究獎(jiǎng)、2009年NSF杰出青年獎(jiǎng)、2011年美國斯隆學(xué)者獎(jiǎng)、2012年雅虎實(shí)驗(yàn)室學(xué)者獎(jiǎng)以及2014年IBM學(xué)者獎(jiǎng)。她還是TED 2015大會(huì)演講嘉賓。

她是世界上頂尖的計(jì)算機(jī)視覺專家之一。她參與建立了兩個(gè)被AI研究者廣泛使用來教機(jī)器分類物體的數(shù)據(jù)庫：Caltech 101和ImageNet。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

她想要打造出一種看得見東西、幫助我們改善生活的機(jī)器。過去15年中，李飛飛一直在教計(jì)算機(jī)看東西。從一個(gè)博士生成長為斯坦福大學(xué)計(jì)算機(jī)視覺實(shí)驗(yàn)室主任，李飛飛不遺余力地朝著困難重重的目標(biāo)邁進(jìn)。她希望創(chuàng)造出一種電子眼，能讓機(jī)器人和機(jī)器看懂世界，更重要的是，能夠了解自己所處的環(huán)境。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

在一場(chǎng)被觀看了120多萬次的TED演講（如下方視頻）中她說：「我總在想著里奧和他將生活的未來世界。」在她心中最理想的未來中，機(jī)器可以看見世界，但目的并不是為了效率最大化，而是為了共情。

以下是李飛飛TED演講：如何教計(jì)算機(jī)理解圖片

下面就來自她這次TED演講稿

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

這是一個(gè)三歲小孩在講述她從一系列照片里看到的東西。

對(duì)這個(gè)世界，她也許還有很多要學(xué)的東西，但在一個(gè)重要的任務(wù)上，她已經(jīng)是專家了：去理解她所看到的東西。我們的社會(huì)已經(jīng)在科技上取得了前所未有的進(jìn)步。我們把人送上月球，我們制造出可以與我們對(duì)話的手機(jī)，或者訂制一個(gè)音樂電臺(tái)，播放的全是我們喜歡的音樂。然而，哪怕是我們最先進(jìn)的機(jī)器和電腦也會(huì)在這個(gè)問題上犯難。所以今天我在這里，向大家做個(gè)進(jìn)度匯報(bào)：關(guān)于我們?cè)谟?jì)算機(jī)視覺方面最新的研究進(jìn)展。 這是計(jì)算機(jī)科學(xué)領(lǐng)域最前沿的、具有革命性潛力的科技。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

是的，我們現(xiàn)在已經(jīng)有了具備自動(dòng)駕駛功能的原型車，但是如果沒有敏銳的視覺，它們就不能真正區(qū)分出地上擺著的是一個(gè)壓扁的紙袋，可以被輕易壓過，還是一塊相同體積的石頭，應(yīng)該避開。我們已經(jīng)造出了超高清的相機(jī)，但我們?nèi)匀粺o法把這些畫面?zhèn)鬟f給盲人。我們的無人機(jī)可以飛躍廣闊的土地，卻沒有足夠的視覺技術(shù)去幫我們追蹤熱帶雨林的變化。安全攝像頭到處都是，但當(dāng)有孩子在泳池里溺水時(shí)它們無法向我們報(bào)警。照片和視頻，已經(jīng)成為全人類生活里不可缺少的部分。它們以極快的速度被創(chuàng)造出來，以至于沒有任何人，或者團(tuán)體，能夠完全瀏覽這些內(nèi)容，而你我正參與其中的這場(chǎng)TED，也為之添磚加瓦。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

直到現(xiàn)在，我們最先進(jìn)的軟件也依然為之犯難：該怎么理解和處理這些數(shù)量龐大的內(nèi)容？所以換句話說，在作為集體的這個(gè)社會(huì)里，我們依然非常茫然，因?yàn)槲覀冏钪悄艿臋C(jī)器依然有視覺上的缺陷。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

”為什么這么困難？“你也許會(huì)問。照相機(jī)可以像這樣獲得照片：它把采集到的光線轉(zhuǎn)換成二維數(shù)字矩陣來存儲(chǔ) ——也就是“像素”，但這些仍然是死板的數(shù)字。它們自身并不攜帶任何意義。 就像”聽到“和“聽”完全不同， ”拍照“和”看“也完全不同。通過“看”，我們實(shí)際上是“理解”了這個(gè)畫面。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

事實(shí)上，大自然經(jīng)過了5億4千萬年的努力才完成了這個(gè)工作，而這努力中更多的部分是用在進(jìn)化我們的大腦內(nèi)用于視覺處理的器官，而不是眼睛本身。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

所以"視覺”從眼睛采集信息開始，但大腦才是它真正呈現(xiàn)意義的地方。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

15年來，從我進(jìn)入加州理工學(xué)院攻讀Ph.D到后來領(lǐng)導(dǎo)斯坦福大學(xué)的視覺實(shí)驗(yàn)室，我一直在和我的導(dǎo)師、合作者和學(xué)生們一起教計(jì)算機(jī)如何去“看”。我們的研究領(lǐng)域叫做 "計(jì)算機(jī)視覺與機(jī)器學(xué)習(xí)"。這是AI（人工智能）領(lǐng)域的一個(gè)分支。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

最終，我們希望能教會(huì)機(jī)器像我們一樣看見事物：識(shí)別物品、辨別不同的人、推斷物體的立體形狀、理解事物的關(guān)聯(lián)、人的情緒、動(dòng)作和意圖。像你我一樣，只凝視一個(gè)畫面一眼就能理清整個(gè)故事中的人物、地點(diǎn)、事件。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

實(shí)現(xiàn)這一目標(biāo)的第一步是教計(jì)算機(jī)看到“對(duì)象”（物品），這是建造視覺世界的基石。在這個(gè)最簡單的任務(wù)里，想象一下這個(gè)教學(xué)過程：給計(jì)算機(jī)看一些特定物品的訓(xùn)練圖片，比如說貓，并讓它從這些訓(xùn)練圖片中，學(xué)習(xí)建立出一個(gè)模型來。這有多難呢？

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

不管怎么說，一只貓只是一些形狀和顏色拼湊起來的圖案罷了，比如這個(gè)就是我們最初設(shè)計(jì)的抽象模型。我們用數(shù)學(xué)的語言，告訴計(jì)算機(jī)這種算法： “貓”有著圓臉、胖身子、兩個(gè)尖尖的耳朵，還有一條長尾巴，這算法看上去挺好的。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

但如果遇到這樣的貓呢？它整個(gè)蜷縮起來了。現(xiàn)在你不得不加入一些別的形狀和視角來描述這個(gè)物品模型。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

但如果貓是藏起來的呢？再看看這些傻貓呢？你現(xiàn)在知道了吧。即使那些事物簡單到只是一只家養(yǎng)的寵物，都可以呈現(xiàn)出無限種變化的外觀模型，而這還只是“一個(gè)”對(duì)象的模型。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

大概在8年前，一個(gè)非常簡單、有沖擊力的觀察改變了我的想法。沒有人教過嬰兒怎么“看”，尤其是在他們還很小的時(shí)候。他們是從真實(shí)世界的經(jīng)驗(yàn)和例子中學(xué)到這個(gè)的。如果你把孩子的眼睛都看作是生物照相機(jī)，那他們每200毫秒就拍一張照。 ——這是眼球轉(zhuǎn)動(dòng)一次的平均時(shí)間。所以到3歲大的時(shí)候，一個(gè)孩子已經(jīng)看過了上億張的真實(shí)世界照片。這種“訓(xùn)練照片”的數(shù)量是非常大的。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

所以，與其孤立地關(guān)注于算法的優(yōu)化、再優(yōu)化，我的關(guān)注點(diǎn)放在了給算法提供像那樣的訓(xùn)練數(shù)據(jù)——那些嬰兒們從經(jīng)驗(yàn)中獲得的質(zhì)量和數(shù)量都極其驚人的訓(xùn)練照片。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

一旦我們知道了這個(gè)，我們就明白自己需要收集的數(shù)據(jù)集，必須比我們?cè)羞^的任何數(shù)據(jù)庫都豐富——可能要豐富數(shù)千倍。因此，通過與普林斯頓大學(xué)的Kai Li教授合作，我們?cè)?007年發(fā)起了ImageNet（圖片網(wǎng)絡(luò)）計(jì)劃。幸運(yùn)的是，我們不必在自己腦子里裝上一臺(tái)照相機(jī)，然后等它拍很多年。我們運(yùn)用了互聯(lián)網(wǎng)，這個(gè)由人類創(chuàng)造的最大的圖片寶庫。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

我們下載了接近10億張圖片并利用眾包技術(shù)（利用互聯(lián)網(wǎng)分配工作、發(fā)現(xiàn)創(chuàng)意或解決技術(shù)問題），像亞馬遜（Amazon）土耳其機(jī)器人（Mechanical Turk）這樣的平臺(tái)來幫我們標(biāo)記這些圖片。在高峰期時(shí)，ImageNet是「亞馬遜土耳其機(jī)器人」這個(gè)平臺(tái)上最大的雇主之一。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

來自世界上167個(gè)國家的接近5萬個(gè)工作者，在一起工作幫我們篩選、排序、標(biāo)記了接近10億張備選照片。這就是我們?yōu)檫@個(gè)計(jì)劃投入的精力，去捕捉一個(gè)嬰兒可能在他早期發(fā)育階段獲取的”一小部分“圖像。他們幫忙給數(shù)百萬張貓、飛機(jī)和人的隨機(jī)圖像貼標(biāo)簽。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

現(xiàn)在回頭看，用大數(shù)據(jù)來訓(xùn)練計(jì)算機(jī)算法的做法或許顯而易見。但是在2007年，這并不顯然。在這段旅途中，我很長一段時(shí)間都非常孤獨(dú)，有些同事友情建議我做些對(duì)獲得終身教職更有用的事。我們?cè)谘芯拷?jīng)費(fèi)方面也一直碰到麻煩，我可能需要重開我的干洗店來為ImageNet籌資。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

我們?nèi)匀辉诶^續(xù)著。在2009年，ImageNet項(xiàng)目誕生了—— 一個(gè)含有1500萬張照片的數(shù)據(jù)庫，涵蓋了22000種物品。這些物品是根據(jù)日常英語單詞進(jìn)行分類組織的。無論是在質(zhì)量上還是數(shù)量上，這都是一個(gè)規(guī)?？涨暗臄?shù)據(jù)庫。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

舉個(gè)例子，在"貓"這個(gè)對(duì)象中，我們有超過62000只貓長相各異，姿勢(shì)五花八門，而且涵蓋了各種品種的家貓和野貓。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

我們對(duì)ImageNet收集到的圖片感到異常興奮，而且我們希望整個(gè)研究界能從中受益，所以以一種和TED一樣的方式，我們公開了整個(gè)數(shù)據(jù)庫，免費(fèi)提供給全世界的研究團(tuán)體。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

那么現(xiàn)在，我們有了用來培育計(jì)算機(jī)大腦的數(shù)據(jù)庫，我們可以回到”算法“本身上來了。因?yàn)镮mageNet的橫空出世，它提供的信息財(cái)富完美地適用于一些特定類別的機(jī)器學(xué)習(xí)算法。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

“卷積神經(jīng)網(wǎng)絡(luò)”，最早由Kunihiko Fukushima，Geoff Hinton，和Yann LeCun在上世紀(jì)七八十年代開創(chuàng)。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

就像大腦是由上十億的緊密聯(lián)結(jié)的神經(jīng)元組成，神經(jīng)網(wǎng)絡(luò)里最基礎(chǔ)的運(yùn)算單元也是一個(gè)“神經(jīng)元式”的節(jié)點(diǎn)。每個(gè)節(jié)點(diǎn)從其它節(jié)點(diǎn)處獲取輸入信息，然后把自己的輸出信息再交給另外的節(jié)點(diǎn)。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

此外，這些成千上萬、甚至上百萬的節(jié)點(diǎn)都被按等級(jí)分布于不同層次，就像大腦一樣。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

在一個(gè)我們用來訓(xùn)練“對(duì)象識(shí)別模型”的典型神經(jīng)網(wǎng)絡(luò)里，有著2400萬個(gè)節(jié)點(diǎn)，1億4千萬個(gè)參數(shù)，和150億個(gè)聯(lián)結(jié)。這是一個(gè)龐大的模型。借助ImageNet提供的巨大規(guī)模數(shù)據(jù)支持，通過大量最先進(jìn)的CPU和GPU，來訓(xùn)練這些堆積如山的模型， “卷積神經(jīng)網(wǎng)絡(luò)” 以難以想象的方式蓬勃發(fā)展起來。它成為了一個(gè)成功體系，在對(duì)象識(shí)別領(lǐng)域，產(chǎn)生了激動(dòng)人心的新成果。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

神經(jīng)網(wǎng)絡(luò)用于解讀圖片，包括一些分層排列的人工神經(jīng)元，神經(jīng)元數(shù)量從幾十到幾百、幾千，甚至上百萬不等。每層神經(jīng)元負(fù)責(zé)識(shí)別圖像的不同成分，有的識(shí)別像素，有的識(shí)別顏色差異，還有的識(shí)別形狀。到頂層時(shí)——如今的神經(jīng)網(wǎng)絡(luò)可以容納多達(dá)30層——計(jì)算機(jī)就能對(duì)圖像識(shí)別出個(gè)大概了。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

上面幾張圖是計(jì)算機(jī)在告訴我們：照片里有一只貓、還有貓所在的位置。當(dāng)然不止有貓了，這是計(jì)算機(jī)算法在告訴我們照片里有一個(gè)男孩，和一個(gè)泰迪熊；一只狗，一個(gè)人，和背景里的小風(fēng)箏；或者是一張拍攝于鬧市的照片比如人、滑板、欄桿、燈柱等等。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

有時(shí)候，如果計(jì)算機(jī)不是很確定它看到的是什么，我們還教它用足夠聰明的方式給出一個(gè)“安全”的答案，而不是“言多必失“——就像人類面對(duì)這類問題時(shí)一樣。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

但在其他時(shí)候，我們的計(jì)算機(jī)算法厲害到可以告訴我們關(guān)于對(duì)象的更確切的信息，比如汽車的品牌、型號(hào)、年份。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

我們?cè)谏习偃f張谷歌街景照片中應(yīng)用了這一算法，那些照片涵蓋了上百個(gè)美國城市。我們從中發(fā)現(xiàn)一些有趣的事：首先，它證實(shí)了我們的一些常識(shí)：汽車的價(jià)格，與家庭收入呈現(xiàn)出明顯的正相關(guān)。但令人驚奇的是，汽車價(jià)格與犯罪率也呈現(xiàn)出明顯的正相關(guān)性，以上結(jié)論是基于城市、或投票的郵編區(qū)域進(jìn)行分析的結(jié)果。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

那么等一下，這就是全部成果了嗎？計(jì)算機(jī)是不是已經(jīng)達(dá)到，或者甚至超過了人類的能力？ ——還沒有那么快。目前為止，我們還只是教會(huì)了計(jì)算機(jī)去看對(duì)象。這就像是一個(gè)小寶寶學(xué)會(huì)說出幾個(gè)名詞。這是一項(xiàng)難以置信的成就，但這還只是第一步。很快，我們就會(huì)到達(dá)發(fā)展歷程的另一個(gè)里程碑：這個(gè)小孩會(huì)開始用“句子”進(jìn)行交流。所以不止是說這張圖里有只“貓”，你在開頭已經(jīng)聽到小妹妹告訴我們“這只貓是坐在床上的”。

為了教計(jì)算機(jī)看懂圖片并生成句子， “大數(shù)據(jù)”和“機(jī)器學(xué)習(xí)算法”的結(jié)合需要更進(jìn)一步。 現(xiàn)在，計(jì)算機(jī)需要從圖片和人類創(chuàng)造的自然語言句子中同時(shí)進(jìn)行學(xué)習(xí)。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

就像我們的大腦，把視覺現(xiàn)象和語言融合在一起，我們開發(fā)了一個(gè)模型，可以把一部分視覺信息，像視覺片段與語句中的文字、短語聯(lián)系起來。

大約4個(gè)月前，我們最終把所有技術(shù)結(jié)合在了一起，創(chuàng)造了第一個(gè)“計(jì)算機(jī)視覺模型”，它在看到圖片的第一時(shí)間，就有能力生成類似人類語言的句子。現(xiàn)在，我準(zhǔn)備給你們看看計(jì)算機(jī)看到圖片時(shí)會(huì)說些什么——還是那些在演講開頭給小女孩看的圖片。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī)： “一個(gè)男人站在一頭大象旁邊。”

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī)還是會(huì)犯很多錯(cuò)誤的。比如： “一只貓?zhí)稍诖采系奶鹤由稀！碑?dāng)然——如果它看過太多種的貓，它就會(huì)覺得什么東西都長得像貓……

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī)： “一個(gè)小男孩拿著一根棒球棍。” 或者…如果它從沒見過牙刷，它就分不清牙刷和棒球棍的區(qū)別。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī)： “建筑旁的街道上有一個(gè)男人騎馬經(jīng)過。” 我們還沒教它Art101（美國大學(xué)藝術(shù)基礎(chǔ)課）

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

計(jì)算機(jī)： “一只斑馬站在一片草原上。” 它還沒學(xué)會(huì)像你我一樣欣賞大自然里的絕美景色。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

所以，這是一條漫長的道路。將一個(gè)孩子從出生培養(yǎng)到3歲是很辛苦的。而真正的挑戰(zhàn)是從3歲到13歲的過程中，而且遠(yuǎn)遠(yuǎn)不止于此。讓我再給你們看看這張關(guān)于小男孩和蛋糕的圖。目前為止，我們已經(jīng)教會(huì)計(jì)算機(jī)“看”對(duì)象，或者甚至基于圖片，告訴我們一個(gè)簡單的故事。計(jì)算機(jī)： ”一個(gè)人坐在放蛋糕的桌子旁?！?/p>

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

而坐在桌子旁邊的人，這個(gè)年幼的男孩就是李飛飛的兒子，里奧。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

但圖片里還有更多信息 ——遠(yuǎn)不止一個(gè)人和一個(gè)蛋糕。計(jì)算機(jī)無法理解的是：這是一個(gè)特殊的意大利蛋糕，它只在復(fù)活節(jié)限時(shí)供應(yīng)。而這個(gè)男孩穿著的是他最喜歡的T恤衫，那是他父親去悉尼旅行時(shí)帶給他的禮物。另外，你和我都能清楚地看出，這個(gè)小孩有多高興，以及這一刻在想什么。

電腦或許能用簡單的語言來描述它所「看見」的圖片，但它卻無法描述照片背后的故事。

后邊這一段話也鼓舞人心，這個(gè)世界的另一端有一部分人在孜孜不倦為視覺領(lǐng)域的進(jìn)步不斷努力。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

在我探索視覺智能的道路上，我不斷地想到Leo和他未來將要生活的那個(gè)世界。當(dāng)機(jī)器可以“看到”的時(shí)候，醫(yī)生和護(hù)士會(huì)獲得一雙額外的、不知疲倦的眼睛，幫他們?cè)\斷病情、照顧病人。汽車可以在道路上行駛得更智能、更安全。機(jī)器人，而不只是人類，會(huì)幫我們救助災(zāi)區(qū)被困和受傷的人員。我們會(huì)發(fā)現(xiàn)新的物種、更好的材料，還可以在機(jī)器的幫助下探索從未見到過的前沿地帶。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事

一點(diǎn)一點(diǎn)地，我們正在賦予機(jī)器以視力。首先，我們教它們?nèi)ァ翱础薄?然后，它們反過來也幫助我們，讓我們看得更清楚。這是第一次，人類的眼睛不再獨(dú)自地思考和探索我們的世界。我們將不止是“使用”機(jī)器的智力，我們還要以一種從未想象過的方式，與它們“合作”。

ImageNet締造者：讓冰冷的機(jī)器讀懂照片背后的故事