丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
國際 正文
發(fā)私信給劉家欣
發(fā)送

0

就這樣,Google用機(jī)器學(xué)習(xí)重新定義了自己

本文作者: 劉家欣 2016-07-05 10:56
導(dǎo)語:Google曾經(jīng)是一家搜索公司,但現(xiàn)在的它更像是一家人工智能公司。

編者按:你一定聽過Google Brain,也一定使用過Google Photos和Gmail等產(chǎn)品,并且贊嘆這些軟件竟然能讀懂自己的照片,理解自己的語言。其實(shí)在它們背后都有人工智能技術(shù)的影子。Google曾經(jīng)是一家搜索公司,但現(xiàn)在的它更像是一家人工智能公司。這其中的轉(zhuǎn)變是如何發(fā)生的,又有怎么樣的故事呢?

本文編譯自Backchannel.com,作者為Steven Levy。

如果你想把人工智能注入你的每一個產(chǎn)品中,你需要培訓(xùn)一支精于此道的程序員團(tuán)隊(duì)。

每一個Googler都會機(jī)器學(xué)習(xí)?

聽說,Google 工程師 Carson Holgate 最近在練習(xí)做一名忍者。

當(dāng)然,這不是軍事方面的訓(xùn)練,今年 26 歲的 Holgate 擁有跆拳道黑帶段位,武藝不凡。她所謂的忍術(shù),指的是算數(shù)邏輯上的概念。Holgate 幾周前加入了這個項(xiàng)目,借此她學(xué)到了比體術(shù)更具威力的技術(shù)——機(jī)器學(xué)習(xí)。作為一名 Android 開發(fā)部門的工程師,Holgate 同時也是今年參加“編程忍者”機(jī)器學(xué)習(xí)項(xiàng)目的 18 名主要程序員之一。這個項(xiàng)目的工程師來自 Google 各個部門的天才,按計劃,會有專家教導(dǎo)他們?nèi)绾芜\(yùn)用機(jī)器學(xué)習(xí)是各自的產(chǎn)品變得更加聰明,更懂人性。但代價就是,項(xiàng)目將因此變的更加復(fù)雜。

就這樣,Google用機(jī)器學(xué)習(xí)重新定義了自己

“忍者” Carson Holgate

“我們內(nèi)部代號是,你想成為一名精通機(jī)器學(xué)習(xí)的忍者嗎?”Christine Robson 是谷歌機(jī)器學(xué)習(xí)小組產(chǎn)品經(jīng)理,負(fù)責(zé)代碼的管理,對我說?!八晕覀冊诠雀璧拿恳粋€團(tuán)隊(duì)都抽調(diào)了人手,并花了六個月的時間教授他們機(jī)器學(xué)習(xí)應(yīng)用課程,通過項(xiàng)目實(shí)訓(xùn),幫助他們在工程項(xiàng)目中運(yùn)用機(jī)器學(xué)習(xí)提升用戶體驗(yàn)。

四年前 Holgate 作為一名計算機(jī)科學(xué)及數(shù)學(xué)雙學(xué)位博士來到了 Google,對于她來說這,是一次絕佳的機(jī)會學(xué)習(xí)世界上最火爆的技術(shù):使用學(xué)習(xí)算法,并通過大量的數(shù)據(jù)“教會”算法更好地完成任務(wù)。多年以來,機(jī)器學(xué)習(xí)被認(rèn)為是一個高端科研項(xiàng)目,只有極少數(shù)的精英科學(xué)家才有可能學(xué)會。那個時代已經(jīng)過去了,新一代基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),模仿碳基生物的大腦,用一套統(tǒng)一的方法論把機(jī)器學(xué)習(xí)的門檻大幅降低了,這套方法論被普遍認(rèn)為是機(jī)器學(xué)習(xí)的“真理”,是把計算機(jī)改造成超級大腦的唯一可行途徑。Google 承諾將擴(kuò)大這類精英人群的數(shù)量,使它成為提升用戶體驗(yàn)的普遍措施。對于像 Holgate 這樣的工程師,忍者計劃是她們走在技術(shù)最前沿的絕佳機(jī)會,通過這項(xiàng)計劃, 他們將學(xué)習(xí)到最先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)?!斑@些人都在開發(fā)不可思議的模型,并借此獲得了博士學(xué)位”。她的語言中掩飾不住敬畏及敬仰之情。這個項(xiàng)目把所有的學(xué)員都稱呼為忍者,這一點(diǎn)讓她起初覺得不舒服,但后來,她還是克服了心理障礙?!耙婚_始我感覺很難接受,但一旦接受了這個設(shè)定,覺得還挺好玩的”。

考慮到 Google 龐大的員工數(shù)量—— 6 萬名員工中大約有一半是工程師,忍者計劃似乎是一個影響相當(dāng)小的項(xiàng)目。但這個項(xiàng)目象征著公司對于機(jī)器學(xué)習(xí)認(rèn)識的改變。盡管機(jī)器學(xué)習(xí)在很久前就成為了 Google 的重要研究方向,并且在這方面,Google 十分熱衷于聘請各類專家——但公司直到 2016 年才真正被機(jī)器學(xué)習(xí)的魅力吸引。去年,CEO Sundar Pichai 宣布:“機(jī)器學(xué)習(xí)是核心技術(shù),我們要把這項(xiàng)技術(shù)融入到我們的每一件產(chǎn)品中,甚至重新設(shè)計產(chǎn)品。經(jīng)過深思熟慮,我們決定在包括搜索,廣告推薦,YouTube,及 Play 商店等產(chǎn)品中廣泛運(yùn)用機(jī)器學(xué)習(xí)。盡管這項(xiàng)計劃目前還處于早期階段,但你會看到我們建立系統(tǒng)性的工程,將之融匯于產(chǎn)品中”。

顯然,如果 Google 決意把機(jī)器學(xué)習(xí)應(yīng)用于所有的產(chǎn)品中,那么,每一個產(chǎn)品都必須有對于這些技術(shù)有深刻見解的工程師參與開發(fā),這與傳統(tǒng)的編程范式有著顯著的區(qū)別。Pedor Domingos 在其機(jī)器學(xué)習(xí)著作 The Master Algorithm (《算法大師》)中寫道,“機(jī)器學(xué)習(xí)是太陽底下的新鮮事,一項(xiàng)能夠不斷改進(jìn)自身的技術(shù)”。開發(fā)出一套機(jī)器學(xué)習(xí)系統(tǒng),需要辨別出有效的信息,設(shè)計針對性的算法,并確保你的所有條件可控且正確。然后(對于程序員來說很難)充分信任你的這套系統(tǒng),將其投入實(shí)際工作環(huán)境中。

“當(dāng)有越來越多的人用這種方式解決問題,我們對此的改進(jìn)速度就會越快”。

目前,他估計整個 Google 的 2.5 萬名工程師當(dāng)中,只有數(shù)千人精通機(jī)器學(xué)習(xí)。大約占到總數(shù)的十分之一,他希望在不久的將來,這個數(shù)字將達(dá)到接近百分之百?!叭绻恳幻こ處煻贾辽賹τ跈C(jī)器學(xué)習(xí)有一定程度的理解,這是極好的”, 他說。

但是這可能嗎?“我們盡量試試”,他說。

令人不安的機(jī)器學(xué)習(xí)

數(shù)年以來,John Giannandrea 在 Google 內(nèi)部都扮演著機(jī)器學(xué)習(xí)重要推動者的角色,如今他成為了搜索部門的主管。但在他剛剛進(jìn)公司的 2010 年(他是在谷歌收購 MetaWeb 時隨之一同加入谷歌的,那家公司的龐大數(shù)據(jù)庫已經(jīng)以知識圖譜的形式整合到搜索業(yè)務(wù)中),他對于機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)的認(rèn)識還停留在最初級階段。在 2011 年期間,他被一條介紹神經(jīng)信息處理系統(tǒng)(NIPS,一個研究機(jī)器學(xué)習(xí)的組織)的新聞?wù)鸷车搅恕C恳荒?,NIPS 的團(tuán)隊(duì)成員都會宣布最新的機(jī)器學(xué)習(xí)研究成果,包括聲音識別,圖像處理等方面的應(yīng)用。常常會出現(xiàn)很多驚人的效果。“當(dāng)我第一次看 NIPS 時,上面討論的那些艱深晦澀的問題讓我費(fèi)解。”他說,“但這是最近三年學(xué)術(shù)界及工業(yè)領(lǐng)域都大熱的領(lǐng)域,去年大約有 6000 人加入了這個組織”。

就這樣,Google用機(jī)器學(xué)習(xí)重新定義了自己

John Giannandrea

這些不斷改進(jìn)的神經(jīng)網(wǎng)絡(luò)算法,以及摩爾定律帶來不斷倍增的計算能力,在 Facebook 和 Google 等公司海量數(shù)據(jù)的驅(qū)動下變得越來越聰明,學(xué)習(xí)能力呈指數(shù)提升,成為機(jī)器學(xué)習(xí)的主流研究方向。Giannandrea 把那些對此擁有極大熱情,并相信機(jī)器學(xué)習(xí)將是公司核心的工程師招致麾下。這群天才中包括 Google Brain 聯(lián)合創(chuàng)始人 Dean,Google Brain 隸屬于 Google X 研究室,研究神經(jīng)網(wǎng)絡(luò)科學(xué)。

谷歌對于機(jī)器學(xué)習(xí)的熱情擁抱并不僅僅代表了編程技術(shù)的轉(zhuǎn)變。換句話說,機(jī)器學(xué)習(xí)帶來的,將是用戶體驗(yàn)的質(zhì)變而非量變。機(jī)器學(xué)習(xí)的前沿是一種基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法,這種算法的靈感來源于人的大腦神經(jīng)結(jié)構(gòu)。Google Brain 就是一個深度學(xué)習(xí)研究項(xiàng)目,而最近宣布市值達(dá)到 5 億美金的人工智能公司 Deepmind 也是這個領(lǐng)域的佼佼者,這個公司在前年被 Google 以 4 億美金收入囊中,旗下產(chǎn)品包括著名的AlphaGo,打破了人工智能不能在圍棋方面打敗人類的迷思。

盡管 Gianandrea 對于各類媒體及預(yù)言家們“人工智能將毀滅人類”的論調(diào)嗤之以鼻,但是他也不贊成“人工智能要改變包括醫(yī)療,交通等一切事物”的論調(diào)。機(jī)器學(xué)習(xí)并不會取代人類,但會改變?nèi)祟悺?/p>

Giannandrea 經(jīng)常喜歡把 Google Photos 作為機(jī)器學(xué)習(xí)的正面例子證明其學(xué)習(xí)能力。這個產(chǎn)品的圖像識別功能不可思議,甚至有時候會令人感到不安。

“搜索一些邊境牧羊犬的圖片”。當(dāng)用戶第一次發(fā)現(xiàn) Photos 能把手機(jī)照片中的寵物狗識別出來時,感受絕對是震撼的。這和傳統(tǒng)的搜索業(yè)務(wù)不同,Photos 通過理解你照片中的物體,從而找出牧羊犬從幼年時期到老年期的各種照片。這對于人類來說當(dāng)然不難,但機(jī)器可以在看過數(shù)千萬張照片之后越來越精準(zhǔn)地識別目標(biāo),這是人類無法做到的。只要它學(xué)會了識別一種物體,就可以通過同樣的辦法識別其他 999 種物體,“這就是它的創(chuàng)新之處,”Giannandrea 對我說,“在各種細(xì)分領(lǐng)域,你都將看到機(jī)器學(xué)習(xí)大放異彩,展現(xiàn)出超越人類的學(xué)習(xí)能力?!?/p>

智能回復(fù)

可以肯定的是,機(jī)器學(xué)習(xí)的概念在 google 內(nèi)部早已流傳甚廣,Google 的創(chuàng)始人們對于人工智能的癡迷是從始至終的。機(jī)器學(xué)習(xí)在 Google 的眾多產(chǎn)品線中早已得到了廣泛的應(yīng)用,盡管不是以機(jī)器學(xué)習(xí)的形式。(早期的機(jī)器學(xué)習(xí)往往使用的是一套較為簡單的統(tǒng)計方法。)

事實(shí)上,近十年以來,Google 都在公司內(nèi)部對工程師進(jìn)行著持續(xù)的機(jī)器學(xué)習(xí)教育。在 2005 年初,時任搜索主管的 Peter Norvig 受到了一名搜索算法科學(xué)家 David Pablo Cohn 的建議,嘗試讓卡耐基梅隆大學(xué)的教授承擔(dān)內(nèi)部機(jī)器學(xué)習(xí)教學(xué)任務(wù)。但最終的結(jié)論是,只有 Google 的內(nèi)部專家有能力教好這項(xiàng)前沿技術(shù)(也許還有國防部可以)。所以他在 43 號建筑(搜索部門的總部)里挑了一個足夠大的房間,在每周三晚上花兩個小時的時間開辦教學(xué)班?!斑@是世界上最好的教學(xué)”,Cohn 說,“這幫工程師的水平比我高出太多了!”這個課程受到了熱捧,事實(shí)上,這個課程的火爆程度超過了所有人的預(yù)料。很多工程師在兩小時的課程結(jié)束后還不肯離去,討論問題直到深夜。多年以后,有些谷歌工程師把課程錄成了段視頻,放到網(wǎng)上供人學(xué)習(xí)。Cohn 相信這些資料足以稱為 Mooc 的優(yōu)質(zhì)資源。在接下來的幾年里,Google 都在機(jī)器學(xué)習(xí)的內(nèi)部培訓(xùn)方面做了不少努力,但沒有以往那樣有組織,系統(tǒng)的培訓(xùn)。Chon 在 2013 年離開 Google 之前,說,“機(jī)器學(xué)習(xí)在谷歌突然成了最重要的事情”。

這種情況持續(xù)到了 2012 年,Giannandrea 突發(fā)奇想,希望能把 Google 內(nèi)部的所有機(jī)器學(xué)習(xí)專家聚集起來,看看能夠做出什么很酷的東西。 于是,Google Brain 項(xiàng)目就此成立,這是 Google X 實(shí)驗(yàn)室里最引人矚目,且匯集最多高端人才的項(xiàng)目。“我們把這幫人挑出來,圈到同一棟樓里,奉上大量咖啡飲料,這幫人以前都在做著機(jī)器感知方面的工作,例如聲音識別及自然語言識別等等,我們決定把工作重心放在語言方面”。

就這樣,Google用機(jī)器學(xué)習(xí)重新定義了自己

Greg Corrado,Brain 聯(lián)合創(chuàng)始人

逐漸的,機(jī)器學(xué)習(xí)的研究成果在越來越多的 Google 大眾產(chǎn)品中被公眾所享用。自從機(jī)器學(xué)習(xí)的研究領(lǐng)域轉(zhuǎn)向了翻譯,聲音,視覺及自然語言的識別,機(jī)器學(xué)習(xí)在 VoiceSearch ,Translate,Photos 等Google 重要產(chǎn)品線得到廣泛應(yīng)用也就不足為奇了。Jeff Dean 說,他和他的團(tuán)隊(duì)對于機(jī)器學(xué)習(xí)的本質(zhì)理解的越深刻,更加傾向于野心勃勃地利用它。“以前,我們可能會在整個應(yīng)用中使用一小部分機(jī)器學(xué)習(xí)的組件,但現(xiàn)在,我們使用機(jī)器學(xué)習(xí)的方式重構(gòu)了整個應(yīng)用程序,而不是不斷改進(jìn)機(jī)器學(xué)習(xí)模塊。Dean 說,如果現(xiàn)在要他把Google 的整個架構(gòu)重寫一遍,他會使用 MapReduce 和 Big Table 的架構(gòu),使整個體系擁有自主學(xué)習(xí)能力。

機(jī)器學(xué)習(xí)還使得產(chǎn)品擁有以前無法想象的新功能。一個典型例子就是 Gmail 里的 SmartReply(智能回復(fù))功能,這個功能最早在 2015 年十一月上線。這個功能的創(chuàng)意來自于 Google Brain 聯(lián)合創(chuàng)始人 Greg Corrado 及 Gmail 工程師 Bálint Miklós 的一段對話。Corrado 先前與 Gmail 團(tuán)隊(duì)合作,利用機(jī)器學(xué)習(xí)處理垃圾郵件問題,以及給郵件分類,Miklós 給出了一個更加激進(jìn)的建議。為什么不利用機(jī)器學(xué)習(xí)增加一個自動回復(fù)功能,方便鍵盤狹窄的智能手機(jī)用戶呢? “我當(dāng)時被這個創(chuàng)意震驚到了,因?yàn)檫@個想法太瘋狂了,Corrado 說,但我想到我們研發(fā)的預(yù)測神經(jīng)網(wǎng)絡(luò),感覺又有成功的可能。我們意識到這是一個絕佳的炫技機(jī)會,我們想挑戰(zhàn)一下自我。

Google 讓 Corrado 和他的團(tuán)隊(duì)長期呆在 Gmail 部門中,結(jié)果就是機(jī)器學(xué)習(xí)在Gmail 產(chǎn)品中越來越普遍的運(yùn)用及效率的不斷提升。與其說機(jī)器學(xué)習(xí)是科學(xué),不如說它是一門藝術(shù)。Corrado 說,就像烹飪一樣,化學(xué)反應(yīng)讓一切充滿不確定性,你要不斷試錯,才能找到最適合你的原材料及烹飪方法。

傳統(tǒng)的人工智能方法依賴于把語言規(guī)則構(gòu)建成體系,但在這個項(xiàng)目中,就像所有現(xiàn)代機(jī)器學(xué)習(xí)一樣,這套系統(tǒng)只需要足夠多的數(shù)據(jù)“喂養(yǎng)”,就能不斷成長,進(jìn)化自身,就像幼童一樣?!拔艺f話的技能并不是從語言學(xué)家身上學(xué)到的,而是通過傾聽別人講話學(xué)的?!盋orrado 對我說。但使只能回復(fù)功能變得切實(shí)可行的,是智能回復(fù)的成功率很容易定義——如果人們使用智能回復(fù)的功能很頻繁,那么這個功能就成功了,而且根據(jù)人們點(diǎn)擊的選項(xiàng)概率,可以不斷改進(jìn)智能回復(fù)的算法。

去年十一月,智能回復(fù)功能推出時引起一陣轟動。現(xiàn)在,Inbox 里面,智能回復(fù)每次會提供三個選項(xiàng),每個選項(xiàng)都是一句話,用戶只需輕點(diǎn)選項(xiàng),就可以免去在小屏幕上打字的痛苦。根據(jù)后臺數(shù)據(jù),在移動設(shè)備上發(fā)出的郵件,有十分之一是機(jī)器學(xué)習(xí)生成的自動回復(fù)?!爱?dāng)它每次出現(xiàn)時,生成的結(jié)果往往還是會令我驚訝和贊嘆。”Corrado 笑著對我說。

改變搜索

智能回復(fù)功能只是 Google 機(jī)器學(xué)習(xí)網(wǎng)絡(luò)的一個小小節(jié)點(diǎn),也許當(dāng)轉(zhuǎn)折點(diǎn)終于到來時,機(jī)器學(xué)習(xí)會真正稱為搜索的必要組成,眾所周知,搜索是 Google 的主營業(yè)務(wù)也是其大部分的收入來源。從某些角度說,搜索功能一直在一定程度上使用人工智能。多年以來,由于搜索引擎對谷歌過于重要,所以始終沒有融入機(jī)器學(xué)習(xí)算法。“由于搜索在公司內(nèi)部占據(jù)的份額巨大,高級管理者深度參與其中,所以很多人都懷疑我們無法真正取得進(jìn)展”,Giannandrea 說。

其中部分阻力源自文化因素——必須要讓那些有極強(qiáng)控制欲的程序員適應(yīng)帶有禪意和玄學(xué)意味的機(jī)器學(xué)習(xí)模式。長期掌管谷歌搜索業(yè)務(wù)的 Amit Singhal 曾是傳奇計算機(jī)科學(xué)家 Gerald Salton 的助手。Salton在文檔檢索方面的開創(chuàng)性工作啟迪 Singhal 幫助 Sergey Brin 和 Larry Page 把研究生時期編寫的代碼,擴(kuò)展成了可以適應(yīng)當(dāng)今網(wǎng)絡(luò)時代的程序。(這使得他成為了“檢索派”的一員。)他從20世紀(jì)的方法中梳理出了令人驚訝的結(jié)果,但如果要將機(jī)器學(xué)習(xí)系統(tǒng)整合到關(guān)系谷歌命脈的復(fù)雜系統(tǒng)中,他卻持懷疑態(tài)度。“進(jìn)入 Google 的前兩年,我負(fù)責(zé)搜索質(zhì)量,試圖用機(jī)器學(xué)習(xí)來改進(jìn)排名”,David Pablo Cohn 說,“結(jié)果發(fā)現(xiàn) Amit 的團(tuán)隊(duì)是全世界最優(yōu)秀的,我們把 Amit 腦海中的所有內(nèi)容都當(dāng)成真理寫死到程序里,他是這個領(lǐng)域的宗師級人物”。

到2014年初,谷歌的機(jī)器學(xué)習(xí)大師們認(rèn)為需要改變現(xiàn)狀?!拔覀兣c排名團(tuán)隊(duì)展開了一系列討論”,Dean 說,“我們認(rèn)為至少應(yīng)該嘗試一下,看看能不能有一些收獲。” 他的團(tuán)隊(duì)所設(shè)想的那個實(shí)驗(yàn)最終成為了搜索的核心:文件排名與搜索請求的匹配程度有多高(需要以用戶的點(diǎn)擊為衡量標(biāo)準(zhǔn))。“我們跟他們說,可以用神經(jīng)網(wǎng)絡(luò)計算額外的分?jǐn)?shù),看看到底有沒有用”。

答案是肯定的。這套系統(tǒng)如今已經(jīng)成為谷歌搜索的一部分,被稱作 RankBrain。它于2015年4月上線。Google 還是像以往一樣對如何改進(jìn)搜索諱莫如深(究竟是與長尾理論有關(guān)?還是更好地解讀了模糊不清的搜索請求?),但 Dean 表示,RankBrain“融入到每一個搜索請求中”,雖然未必會影響所有的排名,但的確對很多搜索請求的排名都產(chǎn)生了影響。另外,實(shí)際的影響幅度也很大。在谷歌計算排名時所使用的數(shù)百個信號中(這些信號可能包括用戶所在的地理位置,或者頁面標(biāo)題是否與搜索請求匹配),RankBrain現(xiàn)在的用途排名第三。

“我們成功利用機(jī)器學(xué)習(xí)改進(jìn)了搜索結(jié)果,這對公司來說意義重大”。Giannandrea 說,“這引發(fā)了很多人的關(guān)注”。 華盛頓大學(xué)教授 Pedro Domingos 則給出了另外一種說法:“檢索派與機(jī)器學(xué)習(xí)派始終都存在斗爭。機(jī)器學(xué)習(xí)最終贏得了勝利”。

培訓(xùn)機(jī)器學(xué)習(xí)團(tuán)隊(duì)

Google 面臨的新挑戰(zhàn)是如何讓所有工程師都熟悉機(jī)器學(xué)習(xí)。還有很多公司也都秉承著相同的目標(biāo),其中最引人關(guān)注的當(dāng)屬 Facebook,該公司與 Google 一樣著迷于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。這一領(lǐng)域的畢業(yè)生變得非常搶手,而 Google 正在努力保持對畢業(yè)生的吸引力:學(xué)術(shù)圈多年以來都流傳著一個玩笑:即使不需要頂尖學(xué)生,谷歌也會招聘他們,避免人才被競爭對手搶走。(這并不準(zhǔn)確,因?yàn)榱硪环矫妫珿oogle 也確實(shí)需要這些預(yù)備人才。) “我的學(xué)生無一例外都得到了 Google 的錄用通知?!?nbsp;Domingos 說。目前看來,競爭的激烈程度有增無減:就在上周,Google 宣布將在蘇黎世開設(shè)一個新的機(jī)器學(xué)習(xí)實(shí)驗(yàn)室,有很多工作崗位有待填補(bǔ)。

但由于學(xué)術(shù)項(xiàng)目尚未培養(yǎng)大量機(jī)器學(xué)習(xí)專家,為員工提供在職培訓(xùn)面成為了必要措施。但這卻并非易事,尤其是對于 Google 這樣的公司而言。這里有很多世界頂尖工程師,他們一生都在研究傳統(tǒng)的編程方式。機(jī)器學(xué)習(xí)卻需要截然不同的思維模式,精通編碼的工程師之所以能有如今的成就,往往是因?yàn)樗麄兿M耆刂埔惶拙幋a系統(tǒng)。機(jī)器學(xué)習(xí)還需要掌握一些數(shù)學(xué)和統(tǒng)計學(xué)知識,這即便對于很多資深黑客來說,也是很少了解的新領(lǐng)域。

就這樣,Google用機(jī)器學(xué)習(xí)重新定義了自己

Christine Robson

同時,這還需要有一定的耐心,“機(jī)器學(xué)習(xí)模型不是一段段靜態(tài)的代碼——隨著你不斷‘喂’給它數(shù)據(jù),它會不斷地動態(tài)變化”,Robson 說?!拔覀円恢痹诓煌5馗履P?,而且還要不斷學(xué)習(xí),增加更多數(shù)據(jù),調(diào)整預(yù)測方式。它就像是一個有生命的東西,這是一種截然不同的開發(fā)模式”。

“這是一個使用不同的算法進(jìn)行實(shí)驗(yàn)的學(xué)科,需要挑選那些真正適合使用場景的訓(xùn)練數(shù)據(jù)?!盙iannandrea 說。盡管他也是新的搜索業(yè)務(wù)主管,但卻仍然把在谷歌內(nèi)部傳播機(jī)器學(xué)習(xí)理念作為自己工作的一部分?!坝嬎銠C(jī)科學(xué)那一部分不會消失,但需要更加關(guān)注數(shù)學(xué)和統(tǒng)計學(xué),而對數(shù)十萬行代碼的關(guān)注度則需要相應(yīng)地降低?!?br/>

至于 Google 所擔(dān)心的新編程范式未能被廣泛接受問題,完全可以通過精細(xì)設(shè)置的上崗培訓(xùn)解決?!皻w根結(jié)底,這些模型中使用的數(shù)學(xué)原理并不那么復(fù)雜”,Dean 說,“Google 多數(shù)軟件工程師都可以掌握?!?br/>

為了進(jìn)一步幫助不斷擴(kuò)容的機(jī)器學(xué)習(xí)專家團(tuán)隊(duì),Google 開發(fā)了一系列強(qiáng)大的工具,幫助他們選擇合適的算法訓(xùn)練模型,加快培訓(xùn)和提煉過程。其中最強(qiáng)大的是 TensorFlow,它可以加速神經(jīng)網(wǎng)絡(luò)的構(gòu)建過程。TensorFlow 源自 Google Brain 項(xiàng)目,由 Dean 和他的同事 Rajat Monga 共同發(fā)明。它能把構(gòu)建系統(tǒng)過程中涉及的晦澀難懂的細(xì)節(jié)變成標(biāo)準(zhǔn)化的內(nèi)容——尤其是在谷歌 2015 年 11 月開始將其開放給公眾后,這種做法的效果更加得以顯現(xiàn)。

盡管谷歌煞費(fèi)苦心地將這種行為描述為一種無私的舉動,但該公司也承認(rèn),如果新一代程序員都能熟悉該公司內(nèi)部的機(jī)器學(xué)習(xí)工具,那對谷歌未來的招聘活動將會起到莫大的幫助。(質(zhì)疑者甚至指出,Google 的 TensorFlow 開源項(xiàng)目是為了追趕 Facebook,后者已經(jīng)在 2015 年 6 月公布了早期機(jī)器學(xué)習(xí)系統(tǒng)的深度學(xué)習(xí)模塊 Torch。)不過,TensorFlow 的功能以及谷歌的開源模式很快受到了程序員的歡迎。

Giannandrea 表示,當(dāng)谷歌首次提供 TensorFlow 課程時,共有 7.5 萬人報名參加。

當(dāng)然,作為一家商業(yè)公司,Google 還是把某些好東西藏了起來,留給自家用。該公司在內(nèi)部擁有一套定制化的機(jī)器學(xué)習(xí)硬件——Tensor Processing Unit (張量處理單元,以下簡稱“TPU”)。他們雖然使用這項(xiàng)創(chuàng)新已經(jīng)多年時間,但直到最近才對外宣布。這是一種針對機(jī)器學(xué)習(xí)程序優(yōu)化的芯片,就像 GPU 是專門針對圖形處理優(yōu)化的芯片一樣。該公司的龐大數(shù)據(jù)中心里使用了數(shù)以千計的 TPU (具體有多少恐怕只有上帝和 Larry Page 才知道)。通過賦予神經(jīng)網(wǎng)絡(luò)這種超級計算能力,TPU 為谷歌帶來了巨大優(yōu)勢?!叭绻麤]有它,我們就無法實(shí)現(xiàn) RankBrain”,Dean 說。

但由于 Google 最需要的還是設(shè)計還提煉這些系統(tǒng)的人才,他們也在不斷嘗試各種方式來為工程師提供機(jī)器學(xué)習(xí)方面的培訓(xùn)。這些培訓(xùn)的規(guī)模各異,其中也包括為期兩天的速成班。Google 希望這只是初步嘗試,工程師隨后還會尋找更多資源來深入學(xué)習(xí)?!耙呀?jīng)有數(shù)千人報名參加下一次課程”,Dean 說。

該公司還在通過其他一些措施,為外部人才提供機(jī)器學(xué)習(xí)培訓(xùn)。今年初春,Google 啟動了 Brain Residency 項(xiàng)目,利用 Google Brain 項(xiàng)目為有潛力的外部人才提供了為期一年的集訓(xùn)?!拔覀兎Q之為你的深度學(xué)習(xí)職業(yè)生涯的開端?!盧obson 說,他負(fù)責(zé)協(xié)助管理這個項(xiàng)目。盡管這 27 名來自不同學(xué)科的機(jī)器學(xué)習(xí)學(xué)員中,有些可能會跳槽到其他公司,但他表示,該公司的目的是讓他們自行發(fā)展,利用自己掌握的先進(jìn)知識在世界各地傳播先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)。

所以,從某種意義上講,Carson Holgate 學(xué)習(xí)的忍者項(xiàng)目正是 Google 維持其在人工智能領(lǐng)域領(lǐng)導(dǎo)地位的核心。

她的課程最初是一個為期 4 周的新兵訓(xùn)練營,由 Google 最先進(jìn)的人工智能項(xiàng)目產(chǎn)品負(fù)責(zé)人提供指導(dǎo),教給他們?nèi)绾螌C(jī)器學(xué)習(xí)融入項(xiàng)目中。“我們把忍者帶進(jìn)會議室,Greg Corrado 站在白板前解釋 LSTM(長短期記憶,神經(jīng)網(wǎng)絡(luò)模型的一種)。他做著夸張的手勢,講述這種系統(tǒng)的工作方式、利用何種數(shù)學(xué)原理、如何應(yīng)用于實(shí)際。”Robson 說,“在最初的4個星期里,我們幾乎用到了我們的所有技術(shù)和所有工具,為的是給他們帶來切身體會”。

如今,Holgate 從新兵訓(xùn)練營畢業(yè)了,她現(xiàn)在正在使用機(jī)器學(xué)習(xí)工具開發(fā)一款 Android 通訊工具,幫助谷歌員工彼此交流。她正在調(diào)整超參數(shù),清理輸入數(shù)據(jù),去掉停止詞。經(jīng)歷了這一切,她已經(jīng)不再回頭,因?yàn)榍懊媸侨斯ぶ悄艿墓饷鞔蟮?,這是 Google 的未來,是一切的技術(shù)核心,甚至決定了公司的一切。

“機(jī)器學(xué)習(xí)”,她說,“這個領(lǐng)域大有可為”。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說