谷歌在人工智能上下了一盤很大的棋

本文作者：新智元

2016-04-30 15:26

導(dǎo)語：本文詳盡梳理了谷歌所有的——沒錯(cuò)，是所有的——人工智能項(xiàng)目及其開發(fā)內(nèi)幕，供你縱覽這家公司打造人工智能帝國(guó)的布局。

【雷鋒網(wǎng)導(dǎo)讀】昨日（4月29日）谷歌CEO在年度公開信中寫道，我們將進(jìn)入人工智能為先的世界，但并沒有透露多少細(xì)節(jié)。本文詳盡梳理了谷歌所有的——沒錯(cuò)，是所有的——人工智能項(xiàng)目及其開發(fā)內(nèi)幕，供你縱覽這家公司打造人工智能帝國(guó)的布局。

谷歌在人工智能上下了一盤很大的棋

谷歌如何打造人工智能帝國(guó)？

這個(gè)搜索巨頭正在將它的人工智能服務(wù)開源，讓每個(gè)人都可以使用。2007 年11月，谷歌通過發(fā)布安卓手機(jī)開源操作系統(tǒng)，為自己在移動(dòng)市場(chǎng)的支配地位奠定了基礎(chǔ)。八年之后，安卓獲得了80%的市場(chǎng)份額，如今谷歌又故技重施——這次開源的是人工智能。

不久前，谷歌公布了分布式TensorFlow，它的機(jī)器學(xué)習(xí)開源平臺(tái)。任何人只要擁有電腦和網(wǎng)絡(luò)連接（并且懂一點(diǎn)點(diǎn)深度學(xué)習(xí)算法）就能使用有史以來最強(qiáng)大的機(jī)器學(xué)習(xí)平臺(tái)。超過50個(gè)谷歌產(chǎn)品已采用了TensorFlow ，以便把深度學(xué)習(xí)（使用深度神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)）當(dāng)作工具來操控。這些產(chǎn)品有的能從照片應(yīng)用程序中認(rèn)出你和你的朋友，有的能改善谷歌的核心搜索引擎。谷歌已經(jīng)成為了一家機(jī)器學(xué)習(xí)公司?，F(xiàn)在谷歌把那些能讓其產(chǎn)品獨(dú)一無二的秘方拿了出來，要讓全世界都來使用。

TensorFlow, 人工智能領(lǐng)域的安卓

TensorFlow是一個(gè)文件庫，它使得研究者和計(jì)算機(jī)科學(xué)家能夠建造出系統(tǒng)，對(duì)諸如照片或音頻等數(shù)據(jù)進(jìn)行分解，并由計(jì)算機(jī)基于這些信息做出關(guān)于未來的決策。這便是機(jī)器學(xué)習(xí)的基礎(chǔ)：計(jì)算機(jī)去理解數(shù)據(jù)，并使用這些數(shù)據(jù)來做出決策。在極端復(fù)雜的情形中，機(jī)器學(xué)習(xí)是一種讓計(jì)算機(jī)變得更聰明的有力武器，而這已屬于更廣泛的、也更難以定義的人工智能領(lǐng)域了。TensorFlow極其復(fù)雜，因?yàn)樗谖『洼敵鰯?shù)據(jù)時(shí)具有極高的精度和速度。它毫無疑問已經(jīng)屬于人工智能工具的范疇。

這里有個(gè)實(shí)質(zhì)性的細(xì)節(jié)：TensorFlow系統(tǒng)使用數(shù)據(jù)流圖。在該系統(tǒng)中，具有多重維度（值）的數(shù)據(jù)從一種數(shù)學(xué)計(jì)算傳遞到下一種數(shù)學(xué)計(jì)算。這些復(fù)雜的數(shù)據(jù)塊被稱為張量（Tensors），那些數(shù)學(xué)計(jì)算過程被稱為節(jié)點(diǎn)（nodes)。數(shù)據(jù)從一個(gè)節(jié)點(diǎn)到下一個(gè)節(jié)點(diǎn)的變化能顯示出數(shù)據(jù)的全面系統(tǒng)關(guān)系。這些張量在節(jié)點(diǎn)圖中流動(dòng)，而這正是 TensorFlow（“張量流”）這一名稱的由來。

當(dāng)然，開源的TensorFlow使得研究人員甚至研究生們都有機(jī)會(huì)用這一專業(yè)級(jí)軟件來工作。但這樣做的真實(shí)后果是，谷歌將有潛力將其影響力滲透到市場(chǎng)上的每家機(jī)器學(xué)習(xí)公司的研究之中。現(xiàn)在，企業(yè)無論大小——不管是微小的初創(chuàng)公司還是與谷歌并肩的巨頭——都可以啟用TensorFlow系統(tǒng)，按自己的需要來調(diào)整它，并使用它來與谷歌進(jìn)行競(jìng)爭(zhēng)。最最要緊的是，TensorFlow的發(fā)布使得谷歌這家全球最大的互聯(lián)網(wǎng)公司具有了人工智能領(lǐng)域的權(quán)威地位。

斯坦福的計(jì)算機(jī)科學(xué)教授Christopher Manning三個(gè)月前就可以使用TensorFlow，所以他的學(xué)生那時(shí)起就有機(jī)會(huì)去擺弄這個(gè)系統(tǒng)。經(jīng)過幾周的使用之后，Manning決定他將在自己的課程中使用TensorFlow。除了把TensorFlow 比喻成人工智能界的安卓之外，他還把TensorFlow平臺(tái)比作Gmail這個(gè)谷歌最普及的郵件服務(wù)。郵件服務(wù)領(lǐng)域仍存在著大量競(jìng)爭(zhēng)者，但Gmail更干凈，并且在大多數(shù)應(yīng)用中更可行。

“并不是說，在TensorFlow出現(xiàn)之前不存在任何高水平的深度學(xué)習(xí)庫?！盡ining 說，“不過大體上，其他庫都是一些三個(gè)學(xué)者加一個(gè)研究生就能搞出來的東西?！?/p>

谷歌在人工智能上下了一盤很大的棋

圖片團(tuán)隊(duì)的研究員 Tom Duerig 說，即使谷歌的雇員能看到用戶的照片，這對(duì)公司的研究也沒什么用。

“我們希望能從根本上加速機(jī)器學(xué)習(xí)研究和部署?！?/strong>

盡管像Torch和Theano等其他應(yīng)用程序也有小的更新，但這次谷歌出動(dòng)全部研發(fā)力量來發(fā)展其機(jī)器學(xué)習(xí)方面的基礎(chǔ)設(shè)施，這是前所未有的。Manning說，一方面，TensorFlow是谷歌送給機(jī)器學(xué)習(xí)社區(qū)的一份大禮（這份禮物能讓用于優(yōu)化神經(jīng)網(wǎng)絡(luò)的時(shí)間減少一百倍），另一方面，谷歌也能通過將該工具開源而間接地獲利。

“少數(shù)幾家公司一直在試圖把人工智能領(lǐng)域中的一大部分有才華者都雇傭到自己手下，特別是在深度學(xué)習(xí)領(lǐng)域?！?Manning說?！肮雀璨皇谴壬茩C(jī)構(gòu)。我可以肯定，當(dāng)谷歌開放這個(gè)平臺(tái)后，我們會(huì)有許多博士生在大學(xué)的時(shí)候就已經(jīng)喜歡上谷歌的深度學(xué)習(xí)工具了。”

谷歌的頂級(jí)工程師，Tensorflow的兩位作者之一（另一位是 Rajat Monga）Jeff Dean在預(yù)估機(jī)器學(xué)習(xí)社區(qū)對(duì)TensorFlow的采用情況時(shí)態(tài)度很謹(jǐn)慎。他說，盡管谷歌在工作中發(fā)現(xiàn)TensorFlow極其有用，但它能否被廣泛采用取決于整個(gè)社區(qū)是否覺得TensorFlow很有用。重要的是，為整個(gè)社區(qū)提供一個(gè)工具，通過使用它人們不僅能更快地構(gòu)建想法，而且能更快地將東西付諸實(shí)現(xiàn)。

“基本上，我們希望能加速機(jī)器學(xué)習(xí)研究和部署。”Dean說。這對(duì)社區(qū)來說是一份大禮，同時(shí)最理想的情況是，社區(qū)的人們也會(huì)進(jìn)行回饋，將他們與其他研究者（以及谷歌）一起研發(fā)出的東西分享出來?！皺C(jī)器學(xué)習(xí)社區(qū)真的非常擅長(zhǎng)改進(jìn)想法，那真的非常好。不過，要對(duì)那些與研究性想法相關(guān)聯(lián)的正在運(yùn)行的代碼進(jìn)行改進(jìn)，那就不太一樣了?！?Dean說。

他也提到TensorFlow將會(huì)幫到那些從從谷歌回到校園的實(shí)習(xí)生，因?yàn)楝F(xiàn)在他們可以進(jìn)入這個(gè)曾經(jīng)為谷歌所專有的系統(tǒng)并繼續(xù)完成他們?cè)诠雀杵陂g尚未完成的工作了。

TensorFlow系統(tǒng)對(duì)個(gè)體研究者來說是一個(gè)十分完整的工具包。該系統(tǒng)是一個(gè)完整的獨(dú)立運(yùn)行庫，擁有各種工具和Apache 2.0許可證，因此它也可以在商業(yè)環(huán)境下使用。人們既可以在臺(tái)式電腦或筆記本上編輯它，也可以在移動(dòng)端應(yīng)用它（首先會(huì)發(fā)布安卓版，之后還會(huì)推出iOS版）。TensorFlow還會(huì)提供學(xué)習(xí)指南和文檔，以供人們了解如何調(diào)整和玩轉(zhuǎn)這個(gè)平臺(tái)。

Manning建議，在移動(dòng)設(shè)備上運(yùn)行深度學(xué)習(xí)算法的能力將成為TensorFlow的一個(gè)重要特征，將它與其他開源系統(tǒng)區(qū)分開來。

對(duì)那些想要直接使用現(xiàn)有系統(tǒng)的人，谷歌提供了一個(gè)預(yù)編寫二進(jìn)制版本以便研究者可以直接使用它。它還擁有一個(gè)應(yīng)用程序接口（API），以供軟件開發(fā)者訓(xùn)練和控制他們的TensorFlow模型。它可不是什么冒牌貨—— 谷歌App以及其他50多個(gè)產(chǎn)品都在使用它的系統(tǒng)。

圖片作者 John Chae

谷歌想讓它的AI遍布四方。谷歌的機(jī)器學(xué)習(xí)和人工智能（谷歌更喜歡稱之為機(jī)器智能）影響了它的許多著名產(chǎn)品。

谷歌AI實(shí)驗(yàn)室揭秘

谷歌正在向全世界開放這個(gè)平臺(tái)，這讓我們有機(jī)會(huì)能瞥見這家公司在發(fā)展機(jī)器學(xué)習(xí)系統(tǒng)方面是怎么想的。

在內(nèi)部，谷歌過去三年都在建造一個(gè)大規(guī)模的人工智能平臺(tái)，而現(xiàn)在谷歌把它向全世界開放。不過，谷歌自己更愿意稱之為機(jī)器智能。他們感到，人工智能這個(gè)詞帶有太多的引申含義，而基本上他們想要做的只是在機(jī)器中實(shí)現(xiàn)真正的智能。

這是他們?cè)诠局幸呀?jīng)使用過許多年的模型：任何想要玩人工神經(jīng)網(wǎng)絡(luò)的工程師都可以創(chuàng)建自己的系統(tǒng)分支然后去擺弄它。這種開放結(jié)構(gòu)允許公司內(nèi)的100個(gè)團(tuán)隊(duì)創(chuàng)建強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù)。

“機(jī)器學(xué)習(xí)是一種核心的、革新性的方式。我們靠它來重新思考我們做事情的方式?！?谷歌CEO Sundar Pichai 在公司2015年十月的電話會(huì)議上說?！拔覀冋谟幸獾匕阉鼞?yīng)用于我們所有的產(chǎn)品，無論是搜索、廣告、YouTube還是Google Play。我們還處于早期階段，但你將會(huì)看到我們?cè)谒羞@些領(lǐng)域以系統(tǒng)性的方式運(yùn)用機(jī)器學(xué)習(xí)。”

歡迎來到谷歌，這里一切皆 AI，AI 乃一切

很難為谷歌的機(jī)器智能研究畫出一張?jiān)敿?xì)的圖，因?yàn)樗傇诟淖儯覞B透到了公司中的幾乎每個(gè)團(tuán)隊(duì)中。

谷歌的工程副總裁John Giannandrea把這稱為一種“嵌入式模型”。我是在位于加州陽光明媚的山景城的谷歌總部的一座造型優(yōu)美的現(xiàn)代建筑里見到他的。我當(dāng)時(shí)身處一個(gè)嚴(yán)格來說不對(duì)公眾開放的樓層里。在我獨(dú)處的間歇里，一位工程師走過來發(fā)現(xiàn)我沒有佩戴員工證。他問我是誰，我說我是一名撰稿人，但這并沒有平息他的疑慮。谷歌以將其研究向公眾開放為榮，但實(shí)驗(yàn)室中的工作仍是嚴(yán)格保密的。

對(duì)我來說，谷歌的嵌入式模型意味著我需要大量的步行來采訪。谷歌總部包括三百五十萬平方英尺的辦公空間，橫跨七英畝的土地。谷歌員工在辦公樓之間騎車來往，還有許多員工在打理得很好的花園里抱著筆記本電腦，有的在解決復(fù)雜的計(jì)算機(jī)科學(xué)難題，有的在趁午后小憩的時(shí)間玩Minecraft游戲。不同的團(tuán)隊(duì)在不同的建筑中工作，而嵌入式機(jī)器智能的研究者們?cè)趫F(tuán)隊(duì)間轉(zhuǎn)換的時(shí)候，也需要在從一棟樓搬到另一棟樓。

在辦公樓內(nèi)部，我看到的東西和普通辦公樓的樣子差不多。里面有小隔間、電腦、顯示器等等，人們正在以平靜的語調(diào)討論問題并緊張地朝我這個(gè)記者投來一撇。墻上有一些凹進(jìn)去的空間，可以供人打盹——總之，就是這些辦公室里常見的東西。

圖片作者：Dave Gershgorn/Popular Science

谷歌圖片研究人員正在谷歌位于山景城的總部里研究機(jī)器智能問題，在一間看起來很平凡的辦公室里。

在組織結(jié)構(gòu)上，這里有一群研究者始終在研究一般性的機(jī)器智能問題，并將其工作反饋給谷歌的圖片應(yīng)用、語音搜索和網(wǎng)絡(luò)搜索等核心產(chǎn)品。還有一些項(xiàng)目，谷歌啟動(dòng)它們是為了能推動(dòng)相關(guān)問題的進(jìn)步。Giannandra舉了手寫文字這個(gè)例子。

“我們，作為一個(gè)公司，希望能理解人們是怎么寫字的。因此我們會(huì)長(zhǎng)久地向它投入，即便我們并沒有形成產(chǎn)品?！彼f。

不過，由于谷歌有如此眾多的產(chǎn)品，通常無論研究出了什么東西，總會(huì)有一款工具能把它用上。（谷歌的手寫文字技術(shù)最終被用于谷歌的筆記軟件 Google Keep。）

“谷歌總是在尋求更好的語音識(shí)別、語言翻譯和語音理解?！?/strong>

當(dāng)確定了研究出的東西能用在哪里之后，研究人員就會(huì)到產(chǎn)品團(tuán)隊(duì)去協(xié)助產(chǎn)品的實(shí)現(xiàn)。產(chǎn)品團(tuán)隊(duì)研發(fā)各種我們都在使用的具體應(yīng)用，例如圖片 App 或谷歌翻譯。

而負(fù)責(zé)一般性研究的團(tuán)隊(duì)們則按照研究興趣來劃分。有一個(gè)團(tuán)隊(duì)聚焦于教計(jì)算機(jī)學(xué)會(huì)“看”，另一個(gè)團(tuán)隊(duì)致力于理解語言，還有一個(gè)團(tuán)隊(duì)尋求更好的語音識(shí)別，等等。

“谷歌總是在尋求更好的語音識(shí)別、語言翻譯和語音理解——所以，這些計(jì)算機(jī)科學(xué)的前沿研究領(lǐng)域是我們始終都會(huì)投入的?！?/p>

有超過1000個(gè)研究人員在谷歌為這些機(jī)器智能應(yīng)用而工作，并在應(yīng)用性研究和理論性研究之間不斷切換。有些研究人員在處理一些更簡(jiǎn)單的問題，這些問題不需要考慮嚴(yán)格意義上的人工智能，而主要是依靠統(tǒng)計(jì)性預(yù)測(cè)方法。

根據(jù)谷歌發(fā)言人Jason Freidenfelds的說法，谷歌那剛剛誕生的母公司Alphabet并不會(huì)對(duì)谷歌的機(jī)器智能研究的進(jìn)展方式產(chǎn)生太大的影響。這些研究人員仍將在作為子公司的Google中工作，但當(dāng)他們需要與Life Sciences或 Google X等其他子公司在機(jī)器學(xué)習(xí)應(yīng)用方面合作時(shí)，也不會(huì)有任何障礙。

未來之聲

谷歌的眾多工具中的一顆冉冉升起的明星是語音搜索。哪怕你還不知道它到底是什么，你也很可能已經(jīng)使用過它了：它是谷歌搜索條中的那個(gè)小小的麥克風(fēng)圖標(biāo)，當(dāng)你按動(dòng)它后，你就可以通過說話而非打字來進(jìn)行搜索。這個(gè)小麥克風(fēng)圖標(biāo)也出現(xiàn)在iPhone和安卓的谷歌搜索App中。在許多智能手機(jī)的安卓搜索條中也能發(fā)現(xiàn)它。

盡管從表面上看它只是Siri的一個(gè)競(jìng)爭(zhēng)產(chǎn)品，谷歌語音搜索實(shí)際上已成為通向谷歌那巨大的知識(shí)庫的第二扇大門。令語言識(shí)別團(tuán)隊(duì)感到高興的是，它正在變得越來越受歡迎。

盡管谷歌并未公布語音搜索相比于文字搜索的份額，它仍然提供了一些統(tǒng)計(jì)證據(jù)：移動(dòng)搜索如今比桌面搜索更受歡迎，移動(dòng)語音搜索去年增長(zhǎng)了一倍，大約50%的美國(guó)手機(jī)和平板用戶知道他們可以用語音向谷歌提問，其中三分之一的人曾用語音向谷歌提問過。

盡管谷歌不會(huì)公布語音搜索到底有多大的使用量，它的新聞發(fā)言團(tuán)隊(duì)仍然通過上面這一串?dāng)?shù)據(jù)讓我確信，語音搜索的使用量極大。

除了每年進(jìn)行數(shù)百次迭代之外，谷歌搜索這些年大致上仍以原先的方式運(yùn)行著。不過，要讓人們足夠有信心來對(duì)著手機(jī)講話，這需要艱苦的拼搏。高級(jí)研究員Francoise Beaufays研發(fā)谷歌語音搜索背后的語音識(shí)別引擎。他說，用戶之所以越來越多，是因?yàn)檎Z音搜索服務(wù)的質(zhì)量提高了。

“當(dāng)我們剛開始做語音識(shí)別時(shí)，用戶并不是完全有信心。他們也會(huì)用它，但你會(huì)發(fā)現(xiàn)有一個(gè)延遲，那時(shí)候技術(shù)還不像現(xiàn)在這么好?！癇eaufays說?！艾F(xiàn)在速度變快了，人們可以方便地在辦公室用語音來做任何事情了。”Beaufays帶著法語口音，說話很快，而當(dāng)她談到神經(jīng)網(wǎng)絡(luò)構(gòu)架的市場(chǎng)，語速就更流暢了。她領(lǐng)導(dǎo)語音團(tuán)隊(duì)拋棄了陳舊的、曾用來識(shí)別聲音的引擎，并用一種新的、更高級(jí)的使用遞歸神經(jīng)網(wǎng)絡(luò)的系統(tǒng)來取代它。

為了讓機(jī)器理解語音，它需要首先學(xué)會(huì)詞和詞組的發(fā)音是怎樣。這意味著，需要大量的音頻文件。這些文件通過算法來處理，該算法會(huì)產(chǎn)生一個(gè)巨大的圖，圖中包含每個(gè)聲音與其他聲音、詞和詞組之間的對(duì)應(yīng)關(guān)系。當(dāng)一段音頻被呈現(xiàn)給電腦時(shí)，它會(huì)這樣進(jìn)行分析：把這段音頻的波形放入圖中移動(dòng)，試圖從圖中找到一條能最好地解釋這段音頻的路徑。

“在這條路徑的終點(diǎn)將會(huì)產(chǎn)生這樣的結(jié)果：‘ 我們檢查了這個(gè)聲音序列，這個(gè)聲音序列對(duì)應(yīng)于這個(gè)詞的序列，而這個(gè)詞的序列則構(gòu)成了這個(gè)句子。”Beaufays說。

你每次進(jìn)行語音搜索時(shí)，音頻都會(huì)被上傳到谷歌服務(wù)器

這一切都要靠那些最初的音頻文件，這些文件被稱為訓(xùn)練數(shù)據(jù)。這些訓(xùn)練數(shù)據(jù)實(shí)際上是從真實(shí)谷歌用戶的數(shù)百萬條語音搜索中得來。每當(dāng)你進(jìn)行語音搜索時(shí)，音頻都會(huì)被上傳到谷歌服務(wù)器，如果如果你選擇允許谷歌使用這音頻，它就會(huì)被谷歌整合到用來訓(xùn)練機(jī)器的音頻庫中去。

不過，數(shù)據(jù)在使用之前還有經(jīng)歷若干步驟。首先（而且對(duì)用戶來說最重要的是），所有的用戶信息都被擦除。這意味著，時(shí)間戳、位置數(shù)據(jù)和用戶資料等東西都會(huì)被擦除。接著這些原始波形被發(fā)送給一位人類速記員，因?yàn)樗惴ㄐ枰恳欢我纛l都附有可靠的文字轉(zhuǎn)寫。所有的音頻都需要這種元數(shù)據(jù)，而一段“壞”的音頻實(shí)際上就是一段未能恰當(dāng)轉(zhuǎn)寫的音頻。有時(shí)候，研究者甚至?xí)橐纛l添加人工噪音，以便讓機(jī)器能理解不同的詞在不同環(huán)境中聽起來是什么樣。

Beaufays強(qiáng)調(diào)，用戶可以選擇是否參與該項(xiàng)目。這很重要，因?yàn)殡S著谷歌持續(xù)地積累越來越多的關(guān)于世界和關(guān)于我們生活的信息，對(duì)隱私的合理關(guān)切正在日益增長(zhǎng)。不過如果你不想讓谷歌使用你的語音，你可以拒絕它使用。而且，在使用語音搜索之后，也可以通過若干方式來刪除搜索記錄。

這些技術(shù)使得語音搜索變得更高效。根據(jù)谷歌的說法，兩年前語音搜索錯(cuò)誤率是25%，這意味著每四個(gè)搜索中就有一個(gè)返回了錯(cuò)誤結(jié)果?，F(xiàn)在，錯(cuò)誤率只有8%。

然而，如果谷歌不能利用用戶的數(shù)據(jù)來訓(xùn)練它的話，會(huì)是什么樣？

聰明的Inbox

上周，谷歌宣布它將在電郵服務(wù)中使用人工智能（如果你使用Inbox App這個(gè)獨(dú)立于Gmail的郵箱服務(wù)的話）。據(jù)Gmail的產(chǎn)品總監(jiān)Alex Gawley說，這也是基于TensorFlow而建立的。

“我們開始看到了我們研究團(tuán)隊(duì)建立的神經(jīng)網(wǎng)絡(luò)的強(qiáng)大力量。” Gawley說?！坝锌赡埽覀兂死斫夂徒M織之外還能協(xié)助做更多的事，也有可能，我們能在寫作郵件之類的事情上幫上忙。”

Inbox的這一功能被稱為“智能回復(fù)”，它本質(zhì)上是一個(gè)遞歸神經(jīng)網(wǎng)絡(luò)，能夠閱讀你的郵件并將它傳遞給另一個(gè)網(wǎng)絡(luò)，后者能產(chǎn)生出三個(gè)可能的回復(fù)。你從中選擇一個(gè)，然后發(fā)送郵件。不過，在隱私方面郵件至少像圖片一樣敏感，如果不是比圖片更敏感的話。

要記住，谷歌沒有任何人人會(huì)讀到你的郵件。不過，關(guān)于“你做了什么選擇”的數(shù)據(jù)將被傳送回去，用于訓(xùn)練整個(gè)模型。智能回復(fù)系統(tǒng)正是靠這來學(xué)習(xí)的。利用這些數(shù)據(jù)，研究者可以讓機(jī)器回答某些問題，并發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)中有哪些需要修改的地方。每個(gè)人都可以使用這個(gè)軟件，這樣，這個(gè)智能回復(fù)服務(wù)便讓我們能夠窺見谷歌的機(jī)器學(xué)習(xí)產(chǎn)品是如何建造的。Inbox團(tuán)隊(duì)內(nèi)部都在利用這個(gè)功能特征來測(cè)試機(jī)器、告訴機(jī)器何為正確何為錯(cuò)誤，這個(gè)過程被稱為“喂狗糧”（dogfooding，這個(gè)詞組的原義是，吃自家狗的狗糧。從這個(gè)詞組能看出，這些技術(shù)咖有多怪異。）

整個(gè)團(tuán)隊(duì)都在使用它，記錄錯(cuò)誤，并用越來越多的數(shù)據(jù)來喂養(yǎng)它。當(dāng)這個(gè)App在受控環(huán)境中能正確地運(yùn)轉(zhuǎn)，并能被規(guī)?；瘯r(shí)，團(tuán)隊(duì)就會(huì)發(fā)布這個(gè)產(chǎn)品。

一個(gè)擁有機(jī)器智能的智能手機(jī)的終極目標(biāo)是：它將成為一個(gè)真正的數(shù)字個(gè)人助理，能進(jìn)行準(zhǔn)確的預(yù)測(cè)，知識(shí)淵博——它將成為你的大腦的一部分，盡管不是天生的部分。

內(nèi)部測(cè)試使得研究者們有機(jī)會(huì)來預(yù)測(cè)當(dāng)神經(jīng)網(wǎng)絡(luò)面臨大規(guī)模數(shù)據(jù)時(shí)可能出現(xiàn)的錯(cuò)誤。例如，剛開始時(shí)，智能回復(fù)服務(wù)傾向于對(duì)每個(gè)人說“我愛你”。而這是因?yàn)椋谒饺肃]件里，“我愛你”是一個(gè)非常常見的詞組，所以機(jī)器會(huì)認(rèn)為它很重要。

所有這些都是為了讓你的工作更容易些——那也正是該公司大部分產(chǎn)品的目標(biāo)。 Google Now這個(gè)谷歌世界里的個(gè)人助理服務(wù)，尤其如此。該團(tuán)隊(duì)的口號(hào)是“讓對(duì)的信息在對(duì)的時(shí)間出現(xiàn)”，Google Now的負(fù)責(zé)人， AparnaChennapragada說，當(dāng)把機(jī)器智能建造到這個(gè)平臺(tái)中去時(shí)，需要進(jìn)行縝密的考量，以便為人的大腦提供協(xié)助。

“你需要挑選出那些對(duì)人類很難，但對(duì)機(jī)器很容易的問題，而不是反著來?！?/strong>Chennapragada說?！拔覀円尲夹g(shù)來為你搬舉重物，這樣你就不需要自己來搬舉重物了?！?/p>

此刻，這個(gè)產(chǎn)品正在探索如何用這些方法來讓你的生活變得更輕松容易。 Chennapragada把這和五年前的語音識(shí)別研究相類比——Google Now已經(jīng)做都不錯(cuò)了，但還不能每次都做對(duì)。

他們正在探索，如何運(yùn)用三種不同類型的數(shù)據(jù)形成有趣的信息來為你服務(wù)。他們認(rèn)為，智能電話是一種“局部注意裝置”，而一個(gè)理想的裝置不應(yīng)該讓你信息過載。

“ 如果你看看我們每個(gè)人是如何使用手機(jī)的，你會(huì)發(fā)現(xiàn)我們是在生活中各種事情的間歇里使用它。使用它時(shí)，你在尋找的是一些點(diǎn)點(diǎn)滴滴的信息。”Chennapragada說。“我們?cè)谒伎嫉囊患率?，我們?cè)鯓硬拍芤砸环N積極的方式代表你行動(dòng)，隨時(shí)隨地的?！?/p>

這便是一個(gè)擁有機(jī)器智能的智能手機(jī)的終極目標(biāo)：它將成為一個(gè)真正的數(shù)字個(gè)人助理，能進(jìn)行準(zhǔn)確的預(yù)測(cè)，知識(shí)淵博——它將成為你的大腦的一部分，盡管不是天生的部分。

為了實(shí)現(xiàn)這一點(diǎn)，你的手機(jī)需要關(guān)于你的數(shù)據(jù)：你的時(shí)間表，你在搜尋什么，你聽什么音樂，以及你要去哪里。這些是最容易獲取的信息，因?yàn)樗鼈円呀?jīng)存在于你的手機(jī)上了。

“我們?cè)谒伎嫉囊患率?，我們?cè)鯓硬拍芤砸环N積極的方式代表你行動(dòng)，隨時(shí)隨地的?！?/strong>

當(dāng)你把個(gè)人信息、通過谷歌知識(shí)圖譜（這個(gè)隨后再講）得到的關(guān)于世界的信息和來自其他用戶的信息聯(lián)合起來時(shí)，世界將來到你的指尖?；蛟S你不知道如何開車去機(jī)場(chǎng)，但你的手機(jī)知道。

關(guān)于谷歌利用眾人信息的方式的另一個(gè)例子是測(cè)量道路交通情況。通過從高速公路上的手機(jī)中提取匿名位置數(shù)據(jù)，谷歌可以辨認(rèn)出汽車們比平時(shí)開得慢。同理，也能辨認(rèn)一家飯館或是咖啡館擁擠不擁擠。

Google Now 代表了谷歌使用人工智能的方式。他們意識(shí)到，那種能轉(zhuǎn)化圖片并告訴你圖片里有什么的一般性智能模型離我們還有好些年的距離。所以現(xiàn)在，他們?cè)趧?chuàng)造由一個(gè)個(gè)工具組成的聯(lián)合體，這些工具能協(xié)調(diào)一致地為用戶提供最好的體驗(yàn)。

組織全世界的信息

好了，上文我提到Google Now借助知識(shí)圖譜來工作。什么是知識(shí)圖譜呢？

前谷歌研究院負(fù)責(zé)人John Giannandrea是2010年加入谷歌的。他曾建立了一家名叫Metaweb的公司，該公司能把互聯(lián)網(wǎng)上的文本和對(duì)象聯(lián)接起來。它是一種與搜索服務(wù)相平行的邏輯服務(wù)——通過它不僅能搜索到想找的東西，而且能搜索到與之類似的東西和信息。很久之前，當(dāng)他還是網(wǎng)景公司的首席技術(shù)官的時(shí)候，他就在做這件事了。（你還記得網(wǎng)景公司嗎？）

這一切都體現(xiàn)在知識(shí)圖譜中。知識(shí)圖譜于2012年首次亮相。當(dāng)你搜索某個(gè)事實(shí)時(shí)，它就會(huì)以相關(guān)信息和文字的方式彈出來。如果你搜索《大眾科學(xué)》雜志何時(shí)建立，谷歌就會(huì)告訴你答案（“1872”）。

這就是谷歌的做法：不僅要為互聯(lián)網(wǎng)編制目錄索引，而且要讓互聯(lián)網(wǎng)變得對(duì)用戶來說更好用、更有用。這也是人工智能第一次闖入谷歌的主要業(yè)務(wù)——搜索。從那時(shí)起，谷歌把它15%的日常搜索業(yè)務(wù)都交給了一個(gè)名叫 RankBrain的人工智能模型。這個(gè)系統(tǒng)實(shí)現(xiàn)的是常識(shí)意義上的搜索——它要處理那些傳統(tǒng)算法無法搞定的查詢。

除了把它整合進(jìn)谷歌的核心搜索算法并把它擴(kuò)展到產(chǎn)品中之外，谷歌還打算做一些登月級(jí)的神奇工作。在這方面，他們的靠山是Geoff Hinton。

Hinton是人工智能界最杰出的思想家之一——人們經(jīng)常把他的名字與Facebook的YannLeCun，谷歌的Andrew Ng（注：已轉(zhuǎn)到百度）以及YoshuaBengio等人相提并論。（實(shí)際上，LeCun,Hinton和Bengio 還在五月份的《自然》雜志上寫了一篇深度學(xué)習(xí)綜述，這篇綜述讀起來像一篇人工智能的教材。）

“在魔術(shù)和神秘之間有一條很細(xì)的線，我們希望讓自己處于正確的一邊?！?/span>

與Hinton對(duì)話，就像在于一個(gè)生活在未來五年之后的人對(duì)話。我們的對(duì)話圍繞著怎樣將文檔變成思維向量，以便機(jī)器能理解和記住冗長(zhǎng)的數(shù)據(jù)，并能通過逆向工程獲得我們大腦用于學(xué)習(xí)的算法。

例如，現(xiàn)在的許多計(jì)算機(jī)程序在分析文本的意義時(shí)，是通過查詢文檔中的單詞的詞典定義和語法這樣的蠻力。然而，要想像人一樣去理解文檔，理想情況下計(jì)算機(jī)就需要能夠?qū)⑽臋n分解為一系列不同的思想?！?/span>

谷歌將會(huì)樂于能夠記錄，并找到其中的原理是什么，文檔里說了什么，一種想法是怎么從前面的想法中流過來的”，Hinton說，“如果我們可以開始做到這些，那么機(jī)器能給你更好的答案，因?yàn)樗嬲刈x了文件并理解了?！?/span>

當(dāng)問及為什么這一點(diǎn)還沒有實(shí)現(xiàn)時(shí)，Hinton說，如果我們想要讓機(jī)器與大腦的理解力相匹配，問題在規(guī)模方面。研究者現(xiàn)在使用的人工神經(jīng)網(wǎng)絡(luò)不具有我們大腦的復(fù)雜性，哪怕把規(guī)模擴(kuò)大到目前的極限也達(dá)不到。最好的系統(tǒng)或許擁有數(shù)億個(gè)需要操作的權(quán)重（在講述如何操作權(quán)重時(shí)，LeCun把它們類比為一個(gè)外表面上有一百萬個(gè)旋鈕的黑盒子。）然而，我們的大腦有上百萬億個(gè)需要操作的權(quán)重——這意味著大腦要處理的信息要高上十萬倍。

盡管被規(guī)模問題所阻撓，Hinton仍然很樂觀，認(rèn)為人工智能研究的這一特征并不會(huì)像過去一樣使它夭折。（人工智能曾經(jīng)歷過“凜冬”，那時(shí)進(jìn)展總是無法滿足預(yù)期，投資也退縮了。）這種樂觀的一個(gè)主要原因是，前面提到的思維向量的觀念正在變得日益流行。不過，在Hinton看來，最讓他感到安慰的是過去五年來的進(jìn)展，特別是在對(duì)象識(shí)別和語音領(lǐng)域。過去這些問題常常被認(rèn)為是太復(fù)雜了，而現(xiàn)在，它們?cè)跇?biāo)準(zhǔn)化測(cè)試中的錯(cuò)誤率已戲劇性地下降。

“它們的表現(xiàn)正在接近人類水平?！?/span>

“它們的表現(xiàn)正在接近人類。不是在所有方面，而是在像對(duì)象識(shí)別這樣的方面。幾年前，做計(jì)算機(jī)視覺的人還會(huì)告訴你，‘不，很多年之內(nèi)計(jì)算機(jī)都達(dá)不到那樣的水平。’ 所以，我們有理由保持樂觀?！盚inton說。

不過，無論機(jī)器能多么好地補(bǔ)充或模擬人腦，如果普通人不明白該怎么使用它，它就毫無意義。所以谷歌才會(huì)打算以這種方式來統(tǒng)領(lǐng)人工智能——讓它在使用者面前盡可能地簡(jiǎn)單。幕布背后的計(jì)算過程是復(fù)雜而動(dòng)態(tài)的，而它所輸出的結(jié)果卻是人人都能用的工具以及可供改善這些工具的手段。如果你想的話，可以用這些手段來改善這些工具。

“在魔術(shù)和神秘之間有一條很細(xì)的線，我們希望讓自己處于正確的一邊。”Google Now的Chennapragada說。

【編者注】本文原刊于2015年年底。2016年，谷歌在人工智能領(lǐng)域大步進(jìn)展，回溯去年谷歌在該領(lǐng)域的大動(dòng)作，可以窺見一個(gè)人工智能帝國(guó)正在慢慢成型。

雷峰網(wǎng)特約稿件，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

7人收藏

分享：

相關(guān)文章

Google 人工智能滴滴 Andrew Ng 深度學(xué)習(xí)

從「全球銷冠」到「Google首選」，XREAL創(chuàng)新驅(qū)動(dòng)引領(lǐng) ...

美團(tuán)無人機(jī)香港首條常態(tài)化航線開航翻山跨海配送效率 ...

全球AI公司實(shí)力排行，為何中企只有百度能進(jìn)第一梯隊(duì) ...

谷歌計(jì)劃將 Gemini 并入 Deepmind，下個(gè)月開始生效

新智元

產(chǎn)業(yè)鏈媒體

「新智元」深度鎖定人工智能及機(jī)器人產(chǎn)業(yè)鏈，關(guān)注產(chǎn)業(yè)前沿資訊，聚集學(xué)術(shù)和產(chǎn)業(yè)領(lǐng)袖，共同建構(gòu)智能 + 產(chǎn)業(yè)的新紀(jì)元。

掃描關(guān)注作者微信

發(fā)私信

當(dāng)月熱門文章

最新文章

“因其偉大，故而艱難”，資深科普作家陳宗周解碼AI七十年

跨境電商如果還在靠堆人力，很快就要被淘汰 | 鯨犀百人談No.34

錯(cuò)過中國(guó)直播帶貨，別再失守美國(guó)私域黃金期 | 鯨犀百人談No.33

驗(yàn)證碼的發(fā)展史與未來預(yù)測(cè) | 科普

機(jī)器學(xué)習(xí)算法中分類知識(shí)總結(jié)！

神經(jīng)網(wǎng)絡(luò)淺講：從神經(jīng)元到深度學(xué)習(xí)

熱門搜索

深度學(xué)習(xí) 馬斯克 DeepMind 車聯(lián)網(wǎng) 科技 ARM 抖音 iWatch 軟銀黃仁勛 Moto

谷歌在人工智能上下了一盤很大的棋

谷歌如何打造人工智能帝國(guó)？

TensorFlow, 人工智能領(lǐng)域的安卓

谷歌AI實(shí)驗(yàn)室揭秘

未來之聲

聰明的Inbox

組織全世界的信息

谷歌如何打造人工智能帝國(guó)？