0
雷鋒網(wǎng)按,一直以來,亞馬遜好像跟高科技搭不上邊,但最近幾年 AWS、Alexa 等高科技產(chǎn)品卻頻頻搶占頭條;而在最近一季財報中,亞馬遜表現(xiàn)亮眼,市值逼近 7000 億美元。這背后是亞馬遜對自己的重塑,其核心是改變原有的孤立文化,將人工智能融進(jìn)公司的每一個細(xì)胞。最近,《連線》雜志就通過一篇長文講述了亞馬遜用 AI “重塑金身”的過程,雷鋒網(wǎng)編譯如下:
2014 年年初,Srikanth Thirumalai 到辦公室見了亞馬遜 CEO Jeff Bezos。Thirumalai 是一位計(jì)算機(jī)科學(xué)家,他 2005 年離開 IBM 加入亞馬遜,負(fù)責(zé)領(lǐng)導(dǎo)電商巨頭的推薦團(tuán)隊(duì)。這次會面 Thirumalai 帶來的可不是簡單的部門發(fā)展問題,而是一項(xiàng)雄心勃勃的新計(jì)劃,他要把最新的 AI 技術(shù)融合進(jìn)自己領(lǐng)導(dǎo)的部門。
他來的時候只帶了“六張紙”。為了提高效率,Bezos 很早前就定了規(guī)矩,給他講新產(chǎn)品和服務(wù)時必須控制在這樣的長度之內(nèi)。此外,這薄薄的六頁紙內(nèi)還得附上一個描述最終產(chǎn)品、服務(wù)或項(xiàng)目的新聞稿。
現(xiàn)在,Bezos 正依靠自己手下的精兵強(qiáng)將把亞馬遜打造成 AI 巨擘,而公司成立之初,其實(shí)它們就與 AI 結(jié)下了不解之緣(產(chǎn)品推薦、發(fā)貨時間表和倉庫機(jī)器人)。但最近幾年,人工智能界又經(jīng)歷了一場革命,機(jī)器學(xué)習(xí)變得更加高效。特別是深度學(xué)習(xí),成了計(jì)算視覺、語音和自然語言處理等技術(shù)快速發(fā)展的催化劑。
21 世紀(jì)進(jìn)入第 2 個十年后,其實(shí)亞馬遜并沒有及時通過 AI 借力,但它們已經(jīng)意識到了這項(xiàng)技術(shù)的迫切性。顯然,AI 將成為這個時代最關(guān)鍵的戰(zhàn)場,包括谷歌、Facebook、蘋果和微軟在內(nèi)的超級巨頭都在這里布下了重兵,而亞馬遜卻沒能及時跟上腳步?!拔覀兿蛎總€團(tuán)隊(duì)的負(fù)責(zé)人都問了同樣的問題,‘你準(zhǔn)備怎么利用這些技術(shù)并把它們整合進(jìn)自己的業(yè)務(wù)?’亞馬遜設(shè)備和服務(wù)業(yè)務(wù)副總裁 David Limp 回憶道。
有心的 Thirumalai 把這件事記在了心上,在年度計(jì)劃會上,他將自己有關(guān)機(jī)器學(xué)習(xí)的想法一股腦說給了 Bezos。當(dāng)時他心里很清楚,整體重做現(xiàn)有系統(tǒng)風(fēng)險實(shí)在太大,但他也深知,經(jīng)過 20 年的調(diào)整,機(jī)器學(xué)習(xí)技術(shù)已經(jīng)在圖像和語音識別這兩個與亞馬遜業(yè)務(wù)不相關(guān)的領(lǐng)域取得了出色的成績。
“業(yè)內(nèi)還沒人真正將深度學(xué)習(xí)應(yīng)用在產(chǎn)品推薦上且把亞馬遜甩開。”他說道。“因此我們先要給自己以信心?!逼鋵?shí) Thirumalai 當(dāng)時還沒做好準(zhǔn)備,但 Bezos 胃口很大。因此,Thirumalai 直接分享了自己更激進(jìn)的方案,即借助深度學(xué)習(xí)重新定義推薦系統(tǒng)的工作方式。在這個過程中,可能會用到他的團(tuán)隊(duì)還沒掌握的技術(shù),不存在的工具,甚至沒人想過的算法。Bezos 喜歡這場賭注,所以 Thirumalai 改寫了新聞稿后就投入到緊張的工作中去了。
亞馬遜搜索業(yè)務(wù)副總裁 Srikanth Thirumalai,開了用機(jī)器學(xué)習(xí)改進(jìn)亞馬遜軟件的先河
有這個先見之明的可不止 Thirumalai 一人,其他部門的負(fù)責(zé)人也曾帶著自己的六張紙來找過 Bezos,他們負(fù)責(zé)的是完全不同的產(chǎn)品,服務(wù)的客戶也不是一群人。不過,他們的想法都與 Thirumalai 類似,即要用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)改造亞馬遜的部分業(yè)務(wù)。其中,還有一些主管提出要重塑現(xiàn)有業(yè)務(wù),比如機(jī)器人和數(shù)據(jù)中心業(yè)務(wù) AWS。還有一些高管提出要創(chuàng)建全新業(yè)務(wù)分支,如基于語音的家用電器,而這個想法最終進(jìn)化成了 Echo。
亞馬遜內(nèi)部的這次頭腦風(fēng)暴產(chǎn)生的影響遠(yuǎn)超單個項(xiàng)目的范疇。Thirumalai 就表示,之前他們部門在開會時,亞馬遜的 AI 人才是不能列席的。“我們會進(jìn)行交流,但不會互相分享太多進(jìn)展情況,因?yàn)檠邪l(fā)中的經(jīng)驗(yàn)無法直接套用或轉(zhuǎn)移?!彼貞浀?。他們成了廣闊工程師海洋上的 AI 孤島。不過,用機(jī)器學(xué)習(xí)改造公司的努力改變了一切。
盡管亞馬遜內(nèi)部一直有“單線程”的文化,但 AI 的加入讓各個團(tuán)隊(duì)開始打破界限,他們開始在項(xiàng)目上攜起手來,與其他團(tuán)隊(duì)分享解決方案成了工作中的新常態(tài)。這樣一來,亞馬遜公司里的 AI 孤島開始相互連接。隨著亞馬遜 AI 野心的增長,各項(xiàng)目面對的挑戰(zhàn)也越來越復(fù)雜,這也為亞馬遜帶來了業(yè)內(nèi)最頂尖的人才,特別是那些想看到自己工作顯出成效的人。對亞馬遜這種一直以客戶服務(wù)為導(dǎo)向的公司來說,這也成了搜羅純研究型人才的好機(jī)會。
在形容自家龐大業(yè)務(wù)的每一部分如何像永動機(jī)一樣協(xié)同運(yùn)作時,亞馬遜經(jīng)常會用到“飛輪”一詞?,F(xiàn)在,這臺永動機(jī)上多了 AI 這個重要的飛輪,它能通過創(chuàng)新為其他團(tuán)隊(duì)提供動力,而別的團(tuán)隊(duì)則可借新技術(shù)開發(fā)新產(chǎn)品和服務(wù),從而影響其他團(tuán)隊(duì)甚至整個公司,形成一個良性循環(huán)。除此之外,亞馬遜還能用機(jī)器學(xué)習(xí)平臺為其他公司提供付費(fèi)服務(wù),在大賺一筆的同時還能拿到更多數(shù)據(jù)進(jìn)一步反哺整個平臺。
從一個深度學(xué)習(xí)領(lǐng)域的追隨者變成令人生畏的巨頭,亞馬遜恐怕耗費(fèi)了無數(shù)個“六張紙”。不過,這場轉(zhuǎn)變的結(jié)果已經(jīng)融入了整個公司,它的印記隨處可見,其中就包括運(yùn)行在全新機(jī)器學(xué)習(xí)架構(gòu)上的推薦系統(tǒng)。在推薦你看什么文本、買什么產(chǎn)品和看什么電影時,亞馬遜變得更智能了。今年,Thirumalai 又?jǐn)埩藗€新活,他成了亞馬遜搜索的主管,準(zhǔn)備把深度學(xué)習(xí)融入這項(xiàng)服務(wù)的 DNA。
“如果你七八年前問我,亞馬遜在 AI 領(lǐng)域到底有多大影響,我肯定會說‘什么都算不上’?!比A盛頓大學(xué)頂級計(jì)算機(jī)科學(xué)教授說道?!暗S后它們便來勢洶洶,而現(xiàn)在已經(jīng)是一方霸主了。”
亞馬遜在 AI 領(lǐng)域的拳頭產(chǎn)品是智能音箱——Echo 和在背后驅(qū)動它的 Alexa 語音平臺。這些項(xiàng)目同樣也是“六張紙”的進(jìn)化結(jié)晶,2011 年它以“運(yùn)營計(jì)劃 1”為名被放在了 Bezos 的辦公桌上。該項(xiàng)目的參與者之一是名為 Al Lindsay 的亞馬遜高管,他 2004 年就加入電商巨頭,當(dāng)時則被調(diào)離原有崗位去協(xié)助全新項(xiàng)目?!耙豢畲竽X完全存在云端的低成本計(jì)算機(jī),靠語音完成交互?!边@就是當(dāng)時他構(gòu)想中的新產(chǎn)品。
不過,想打造這樣的系統(tǒng),也就意味著要將 Bezos 最愛的《星際迷航》系列中那臺話嘮計(jì)算機(jī)變成現(xiàn)實(shí)??墒?,它需要的人工智能技術(shù)卻是亞馬遜最缺乏的。更可怕的是,那些有能力完成這套系統(tǒng)的專家中,很少有人愿意為亞馬遜工作。谷歌和 Facebook 搜羅走了大量 AI 頂級人才?!拔覀儸F(xiàn)在是弱者?!盠indsay 說道,他現(xiàn)在已經(jīng)貴為副總裁。
Alexa 引擎副總裁 Al Lindsay 認(rèn)為亞馬遜招聘人才時是個弱者
“亞馬遜給人的印象不好,學(xué)界認(rèn)為它們對研究型人才不友好。”華盛頓大學(xué)教授 Domingos 說道。亞馬遜一心只想著消費(fèi)者和其零碎的文化氛圍不符合學(xué)術(shù)界的調(diào)調(diào),而且它們的待遇也比不過競爭對手?!霸诠雀枘憔拖襁€用著尿不濕的孩子,可以為所欲為?!?Domingos 說道。“在亞馬遜你可能得在小隔間里自己設(shè)置電腦。”更可怕的是,外界一直認(rèn)為亞馬遜是一家將創(chuàng)新工作守在公司機(jī)密下的公司。2014 年,機(jī)器學(xué)習(xí)大神 Yann LeCun 受邀在內(nèi)部會議上向亞馬遜的科學(xué)家做演講。收到邀請時,其實(shí) LeCun 已經(jīng)拿到了 Facebook 的工作邀約,但他還是去了亞馬遜。不過,在亞馬遜的經(jīng)歷讓 LeCun 很震驚。他先是在一個坐了 600 人的禮堂演講,隨后進(jìn)了會議室,在這里等著一波接一波的問題小組。不過,當(dāng) LeCun 反問一些問題時,卻沒得到任何回應(yīng)。這段經(jīng)歷讓他決定轉(zhuǎn)投 Facebook,跟亞馬遜徹底說了拜拜。當(dāng)然,F(xiàn)acebook同意開源 AI 團(tuán)隊(duì)的大部分工作也是一大吸引力。
由于亞馬遜沒什么 AI 人才,所以它們只能憑著超厚的錢包開始買買買。“在 Alexa 的開發(fā)初期,我們買了很多公司?!盠imp 說道。2011 年 9 月,它們吞下了 Yap,一家語音撰文子公司。2012 年 1 月,亞馬遜又買下了 Evi,一家來自英國劍橋的 AI 公司,它們的軟件能像 Siri 一樣響應(yīng)各種語音要求。2013 年 1 月,它們又收了 Ivona,這家波蘭公司在文本轉(zhuǎn)語音上有自己的一套,而該技術(shù) Echo 開口說話的關(guān)鍵。
不過,亞馬遜的保密文化還是阻礙了它們從學(xué)術(shù)界吸引頂級人才的腳步。原本亞馬遜想將業(yè)內(nèi)的超級明星 Alex Smola 招致麾下?!八_實(shí)稱得上是深度學(xué)習(xí)教父之一?!眮嗰R遜 AWS 業(yè)務(wù)深度學(xué)習(xí)和 AI 主管 Matt Wood 介紹道。不過,亞馬遜卻不愿向他或其它候選人透露入職后到底要干什么。最終 Smola 拒絕了這個 offer,選擇在卡耐基梅隆的一個實(shí)驗(yàn)室安頓下來。
Alexa 主管 Ruhi Sarikaya 與 Lindsay
“即使是在 Echo 發(fā)布前,我們依然不受待見。”Lindsay 說道?!八麄儠f,‘我為什么要在亞馬遜工作,我對賣貨可沒興趣?!?/p>
不過,亞馬遜有自己的閃光點(diǎn)。由于它們會現(xiàn)在藍(lán)圖中放出產(chǎn)品功能,而有些功能挑戰(zhàn)性十足,這就會吸引許多野心勃勃的科學(xué)家。Echo 的語音特性需要相當(dāng)程度的會話 AI 技術(shù)支持,比如“喚醒詞”、識別并轉(zhuǎn)譯命令、提供正確答案等,而這些技術(shù)當(dāng)時都不存在。
即使亞馬遜沒有公布最終產(chǎn)品是什么,這個項(xiàng)目也吸引了 Rohit Prasad(備受尊敬的語音識別科學(xué)家)的關(guān)注。在他看來,亞馬遜缺乏 AI 專家是它們的一大特點(diǎn),而不是 bug?!斑@里是一塊帶開墾的新天地?!彼f道。“谷歌和微軟搞語音項(xiàng)目已經(jīng)很多年了。在亞馬遜我們可能得從頭做起并解決很多難題?!?013 年剛加入亞馬遜,他就被派去做 Alexa 項(xiàng)目。“這款設(shè)備還只是個硬件,而且處在最早階段?!彼貞浀?。
Echo 音箱面臨的最棘手問題是被稱為遠(yuǎn)場語音識別的技術(shù),為了它亞馬遜不得不開辟新天地。這項(xiàng)技術(shù)不但包含轉(zhuǎn)換并譯出遠(yuǎn)處傳來的語音命令,還要克服各種外界噪音和其它聽覺干擾。另一大挑戰(zhàn)則是設(shè)備不能花太多時間去理解語音命令,它需要將語音傳到云端并迅速反饋答案,整個過程得像順暢的聊天。想打造一套能在吵雜環(huán)境下理解并回應(yīng)各種詢問的機(jī)器學(xué)習(xí)系統(tǒng)需要天量的數(shù)據(jù),而且這些數(shù)據(jù)從哪來也是個麻煩事。
使用 Alexa 的產(chǎn)品越來越多
此前就有人研發(fā)過遠(yuǎn)場技術(shù),但這項(xiàng)技術(shù)其實(shí)埋在了三叉戟核潛艇的鼻錐里,當(dāng)時研發(fā)費(fèi)用花了十億美元。亞馬遜可不造核潛艇,它們只是想把這項(xiàng)技術(shù)整合進(jìn)一個廚房設(shè)備里,它必須足夠便宜才行?!爱?dāng)時我的團(tuán)隊(duì)里有 90% 的人都不相信這事能辦成?!盤rasad 說道?!拔覀兤鋵?shí)有個技術(shù)咨詢委員會,但亞馬遜沒告訴它們我們在干什么。不過它們好像有些先知先覺,直接告訴我們,別碰遠(yuǎn)場識別?!?/p>
Prasad 豐富的經(jīng)驗(yàn)讓他對這個項(xiàng)目充滿信心。不過,亞馬遜卻沒有一個能將機(jī)器學(xué)習(xí)應(yīng)用于產(chǎn)品開發(fā)的系統(tǒng)。“我們有不少科學(xué)家在搞深度學(xué)習(xí)研究,但亞馬遜沒有基礎(chǔ)設(shè)施將它們變成實(shí)際產(chǎn)品?!彼f道。好消息是亞馬遜體系內(nèi)有所有零部件,比如一個無與倫比的云服務(wù),裝滿 GPU 能輕松運(yùn)行機(jī)器學(xué)習(xí)算法的數(shù)據(jù)中心和用不完的工程師。
他的團(tuán)隊(duì)利用這些零部件搭建了一個平臺,而這個平臺本身就是一筆寶貴的財富,遠(yuǎn)超打造 Echo 任務(wù)的價值。“當(dāng)我們搞定了 Echo 這款遠(yuǎn)場語音識別設(shè)備,就能獲得做更大事的機(jī)會——我們可以將 Alexa 做成語音服務(wù)。”Spyros Matsoukas 說道,他是 Alexa 高級首席科學(xué)家。他們擴(kuò)展 Alexa 的一種直接方式是允許第三方開發(fā)者打造自己的語音技術(shù)小程序,也就是后來我們所說的“技能”,這些“技能”可在 Echo 上運(yùn)行。不過,這僅僅是個開始。
亞馬遜資深首席科學(xué)家 Spyros Matsoukas
從 Echo 身上抽出 Alexa 的魂魄后,亞馬遜的 AI 文化開始逐漸凝聚起來。公司的各個團(tuán)隊(duì)開始意識到,Alexa 也可以為它們旗下的各種項(xiàng)目提供語音服務(wù)?!坝谑歉鞣N數(shù)據(jù)和技術(shù)開始凝聚在一起?!盤rasad 說道。隨后,第一批亞馬遜產(chǎn)品開始整合 Alexa。只要開口,你就能在 Alexa 設(shè)備上訪問 Amazon 音樂、Prime 視頻和你在主要購物網(wǎng)站上的個性化推薦等。接著,這項(xiàng)技術(shù)的覆蓋面開始變的更廣?!耙坏┪覀儞碛辛嘶A(chǔ)語音能力,我們就能把它融入到非 Alexa 設(shè)備中,比如 Fire TV、語音購物及最終的 AWS。”Lindsay 說道。
亞馬遜內(nèi)部漂浮的 AI 孤島終于越來越近了。
另一個促進(jìn)亞馬遜轉(zhuǎn)型的關(guān)鍵環(huán)節(jié)是,一旦有數(shù)百萬用戶開始使用 Echo 或其他 Alexa 設(shè)備,就意味著它們正式在該領(lǐng)域扎根了。亞馬遜能獲得海量的數(shù)據(jù),很有可能是史上最大的語音驅(qū)動設(shè)備的交互集合。這些數(shù)據(jù)成了亞馬遜招聘人才最好的籌碼。仿佛突然之間,原來對電商巨頭嗤之以鼻的機(jī)器學(xué)習(xí)專家都想來這工作了?!癆lexa 吸引力如此巨大,原因之一就是,只要你賣出一臺設(shè)備,就獲得了反饋資源。這其中不但包括用戶反饋,還包括實(shí)打?qū)嵉臄?shù)據(jù),它們對技術(shù)的提升,尤其是底層平臺相當(dāng)重要?!盧avi Jain 說道,他去年才加入亞馬遜,現(xiàn)任該公司機(jī)器學(xué)習(xí)副總裁。
因此,隨著使用 Alexa 人數(shù)的不斷增加,亞馬遜獲得的信息不但能提升系統(tǒng)表現(xiàn),還能為自家的機(jī)器學(xué)習(xí)工具和平臺充電,同時還讓自己成為機(jī)器學(xué)習(xí)科學(xué)家趨之若鶩的大磁鐵。
這個重要的“飛輪”終于轉(zhuǎn)起來了。
2014 年起,亞馬遜開始面向 Prime 會員銷售 Echo。同年,Swami Sivasubramanian 開始愛上機(jī)器學(xué)習(xí)。當(dāng)時的他負(fù)責(zé) AWS 數(shù)據(jù)庫和分析業(yè)務(wù),回老家(印度)探親的他由于沒倒過來時差,深夜還在擺弄類似谷歌 Tensorflow 和 Caffé 等工具,這可是 Facebook 和學(xué)界都非常青睞的機(jī)器學(xué)習(xí)框架。熟悉了之后他發(fā)現(xiàn),如果將這些工具與亞馬遜的云服務(wù)相結(jié)合,能產(chǎn)生難以估量的巨大價值。他認(rèn)為,通過降低云計(jì)算中機(jī)器學(xué)習(xí)算法的難度,亞馬遜能深挖出更多潛在的需求?!拔覀兠總€月都為數(shù)百萬開發(fā)者提供服務(wù)?!彼f道。“他們中大多數(shù)人都不是麻省理工的教授,而是沒有機(jī)器學(xué)習(xí)背景的普通開發(fā)者?!?/p>
亞馬遜 AI 副總裁斯 Swami Sivasubramanian
深思熟慮之后,他帶著自己“史詩級”的六張紙去了 Bezos 的辦公室。從某種程度上來說,那六張紙就是為 AWS 服務(wù)添加機(jī)器學(xué)習(xí)服務(wù)的藍(lán)圖。不過,Sivasubramanian 的眼光放的更遠(yuǎn):他想讓 AWS 成為整個行業(yè)機(jī)器學(xué)習(xí)活動的中心。
從某種意義上來說,為成千上萬的亞馬遜云服務(wù)用戶提供機(jī)器學(xué)習(xí)是大勢所趨?!爱?dāng)我們第一次整合出 AWS 的原始商業(yè)計(jì)劃時,我們的任務(wù)是拿到那些只有少數(shù)財大氣粗的組織才有的技術(shù),并將其進(jìn)行大范圍推廣。”AWS 機(jī)器學(xué)習(xí)高管 Wood 解釋道。“在計(jì)算、存儲、分析和數(shù)據(jù)庫上,我們成功做到了。亞馬遜在機(jī)器學(xué)習(xí)上也走了相同的道路?!备欣氖牵珹WS 團(tuán)隊(duì)可以借鑒公司內(nèi)部其他團(tuán)隊(duì)積累的經(jīng)驗(yàn)。
2015 年,AWS 的亞馬遜機(jī)器學(xué)習(xí)首次上線,它讓類似 C-Span 的用戶設(shè)置一個是人面部列表,Woods 說道。Zillow 用它來估算房價,Pinterest 則用它來做視覺搜索。此外,還有幾家自動駕駛新創(chuàng)公司在用 AWS 機(jī)器學(xué)習(xí)搞道路模擬,以快速提升產(chǎn)品競爭力。
一年以后,AWS 又推出了新的機(jī)器學(xué)習(xí)服務(wù),這次它們更直接的借鑒了 AWS 的創(chuàng)新,加入了一種名為 Polly 的文本轉(zhuǎn)語音組件和一種名為 Lex 的自然語言處理引擎。這些新功能讓 AWS 的客戶能打造自己的迷你版 Alexa。除此之外,亞馬遜還有了視覺服務(wù) Rekognition,它們要像谷歌、Facebook 和蘋果那樣在圖像識別領(lǐng)域掌握自己的魔法。
這些機(jī)器學(xué)習(xí)服務(wù)不但成了亞馬遜的金礦,還是電商巨頭 AI 飛輪的關(guān)鍵點(diǎn),無論是 NASA 還是橄欖球大聯(lián)盟,都成了亞馬遜機(jī)器學(xué)習(xí)服務(wù)的大客戶。隨著企業(yè)紛紛在 AWS 內(nèi)建立起重要的機(jī)器學(xué)習(xí)工具,它們未來另起爐灶與電商巨頭競爭的可能性變得越來越小。
就拿 Infor 這家公司來說,它們是企業(yè)應(yīng)用領(lǐng)域的巨頭,最近還發(fā)布了一款名為 Coleman 的應(yīng)用,該應(yīng)用讓用戶能自動處理各種流程、分析性能,并通過語音對話界面與數(shù)據(jù)進(jìn)行交互。這可不是 Infor 從零開始打造的聊天機(jī)器人,而是使用 AWS 的 Lex 技術(shù)生成的。“反正亞馬遜已經(jīng)做好了,所以我們干嘛還要花時間重來一遍呢?我們了解自己的客戶,這款應(yīng)用絕對適合他們?!盜nfor 高級副總裁 Massimo Capoccia 解釋道。
AWS 在以太網(wǎng)上的統(tǒng)治力也讓它擁有了對手沒有的戰(zhàn)略優(yōu)勢,尤其是谷歌,搜索巨頭希望用自己在機(jī)器學(xué)習(xí)上的領(lǐng)先來追趕 AWS 在云計(jì)算上的地位。誠然,谷歌能在服務(wù)器上給用戶提供速度超快的機(jī)器學(xué)習(xí)優(yōu)化芯片,但 AWS 在交互上更為簡單方便,而且亞馬遜的完整鏈條還方便公司們銷售產(chǎn)品?!熬拖?Willie Sutton 說的,他之所以去搶銀行,是因?yàn)槟抢锎媪撕芏噱X?!盌igitalGlobe CTO Walter Scott 在解釋自家公司為何選擇亞馬遜當(dāng)合作伙伴時打了個形象的比方?!拔覀冞x擇 AWS 來搞機(jī)器學(xué)習(xí),是因?yàn)槲覀兊目蛻舳荚谶@?!?/p>
在去年 11 月的 AWS re:Invent 大會上,亞馬遜推出了一款更為全面的機(jī)器學(xué)習(xí)產(chǎn)品:SageMaker,它雖然看起來復(fù)雜,但其實(shí)是個相當(dāng)易用的平臺。它的創(chuàng)造者之一就是 Alex Smola,那位五年前拒絕了亞馬遜的機(jī)器學(xué)習(xí)大神。當(dāng) Smola 決定重返機(jī)器學(xué)習(xí)行業(yè)時,他就立志要打造一款強(qiáng)大的工具,讓普通的軟件開發(fā)人員也用上這項(xiàng)技術(shù),因此他選擇回到亞馬遜,這個能將機(jī)器學(xué)習(xí)威力產(chǎn)生最大影響的地方?!艾F(xiàn)在的亞馬遜絕對不能錯過?!彼忉尩?。“你能寫出漂亮的論文,但如果不做出真正的產(chǎn)品,就不會有人用你漂亮的算法。”
當(dāng) Smola 告訴 Sivasubramanian,打造一個惠及數(shù)百萬人的機(jī)器學(xué)習(xí)工具比寫一篇漂亮的論文更重要時,他得到了一個驚喜的回復(fù)?!澳愕恼撐囊粯涌梢园l(fā)表?。 盨ivasubramanian 說道。是的,你沒看錯,亞馬遜現(xiàn)在也有自由的環(huán)境了?!斑@不僅有助于吸引頂尖人才,還讓外界了解了亞馬遜到底在研究什么?!盨pyros Matsoukas 說道,他就是亞馬遜這套開放方針的推動者和制定者。
當(dāng)然,現(xiàn)在就斷定 SageMaker 將成為數(shù)百萬用戶的首選還有些早,不過每個客戶都會發(fā)現(xiàn)它們在亞馬遜上投入了巨大的資金。同時,該平臺也足夠成熟,就連包括 Alexa 團(tuán)隊(duì)在內(nèi)的亞馬遜內(nèi)部團(tuán)隊(duì)也準(zhǔn)備轉(zhuǎn)向 SageMaker,與外部公司使用相同的工具集。它們相信這能省下大量的工作時間,使自己能專注于解決更為復(fù)雜的算法任務(wù)。
即使最終只有一部分 AWS 用戶選擇 SageMaker,亞馬遜也能拿到大量有關(guān)系統(tǒng)表現(xiàn)的數(shù)據(jù),促使它們對數(shù)據(jù)進(jìn)行持續(xù)改進(jìn)。這又形成了一個良性循環(huán),更好地平臺必然會帶來更多用戶。飛輪處在高速運(yùn)轉(zhuǎn)中。
隨著機(jī)器學(xué)習(xí)的逐漸成熟,亞馬遜的 AI 專家現(xiàn)在已經(jīng)遍布了旗下各個團(tuán)隊(duì),這讓 Bezos 感到非常滿意。雖然亞馬遜沒有設(shè)立 AI 中心,但它們已經(jīng)有了一個專門負(fù)責(zé)機(jī)器學(xué)習(xí)普及和支持的部門。同時,它們還有一些專注于將新技術(shù)導(dǎo)入公司項(xiàng)目的應(yīng)用研究。眼下,亞馬遜的核心機(jī)器學(xué)習(xí)小組由 Ralf Herbrich 領(lǐng)導(dǎo),這位高管此前曾在微軟和 Facebook 兩家巨頭待過,2012 年才轉(zhuǎn)投亞馬遜?!肮緝?nèi)部建立個自己的社區(qū)非常重要?!彼f道(這個項(xiàng)目同樣也是六張紙演化而來的)。
Ralf Herbrich 的部分職責(zé)包括培養(yǎng)亞馬遜快速成長的機(jī)器學(xué)習(xí)文化。由于它們堅(jiān)持以客戶為中心的政策,因此解決問題比漫無目的的研究更重要。亞馬遜的高管也承認(rèn),他們招聘時更偏向那些經(jīng)世致用,真正有興趣打造新事物的人,而不是那些追求科學(xué)突破的人。Facebook 的 LeCun 則從一個角度表示:“即使不領(lǐng)導(dǎo)這些知識先鋒,你也能做的很好?!?/p>
不過,在培養(yǎng)員工適應(yīng)人工智能上,亞馬遜正在學(xué)習(xí) Facebook 和谷歌的經(jīng)驗(yàn)。它們會開設(shè)許多有關(guān) AI 的內(nèi)部課程,而且從 2013 年起,每年春天亞馬遜都會在總部舉辦一次內(nèi)部的機(jī)器學(xué)習(xí)學(xué)術(shù)會議?!皠傞_始只有幾百人參會,現(xiàn)在已經(jīng)有幾千人了?!盚erbrich 說道?!拔餮艌D總部最大的會議室也容不下那么多人同時開會,所以我們只能通過視頻直播向園區(qū)內(nèi)其他六個會議室傳達(dá)會議情況了?!币晃粊嗰R遜高管表示,如果人數(shù)繼續(xù)增加,恐怕這個會就不能叫做亞馬遜機(jī)器學(xué)習(xí)大會了,直接叫亞馬遜就行。
Herbrich 的團(tuán)隊(duì)還在繼續(xù)推動機(jī)器學(xué)習(xí)融入公司的每一個細(xì)胞。舉例來說,產(chǎn)品交付團(tuán)隊(duì)想要更好地預(yù)測客戶訂單到底要用哪種尺寸的盒子包裝(一共 8 種尺寸),所以它們就找了 Herbrich 尋求幫助。“產(chǎn)品交付團(tuán)隊(duì)不需要另設(shè)專門的科學(xué)家小組,但它們需要這些算法,而且用起來得簡單?!盚erbrich 說道。在另一個例子中,David Limp 講述了亞馬遜是如何預(yù)測用戶購買新產(chǎn)品可能性的。“我在消費(fèi)電子領(lǐng)域摸爬滾打 30 年了,其中有 25% 的工作都需要人類判斷、電子表格和各種魔術(shù)貼來完成?!彼f道?!暗尤霗C(jī)器學(xué)習(xí)后,我們的失誤率開始顯著下降?!?/p>
即使如此,有時候 Herbrich 也得用上最尖端的技術(shù)。就拿亞馬遜生鮮服務(wù)來說,雖然該服務(wù)運(yùn)營時間已經(jīng)有十年之久,但怎樣更好地評估蔬菜和水果的質(zhì)量依然是個麻煩事。畢竟人類評判速度太慢,而且容易前后不一致。于是,他在柏林的團(tuán)隊(duì)搞了搭載傳感器的硬件和新算法,彌補(bǔ)了現(xiàn)有系統(tǒng)不能觸摸和嗅探食物味道的能力?!叭曛螅覀兙湍苣贸鲈萎a(chǎn)品,到時判斷生鮮食品的質(zhì)量就更簡單也更可靠了?!盚erbrich 說道。
不用說,這樣的技術(shù)進(jìn)步肯定能逐漸滲入亞馬遜的整個生態(tài)中。以最新的 Amazon Go 無人超市為例,其負(fù)責(zé)人就表示自己從 AWS 項(xiàng)目中學(xué)到了不少?!安贿^,AWS 也是受益者?!盇mazon Go 技術(shù)副總裁 Dilip Kumar 說道。Amazon Go 有自己獨(dú)特的流媒體數(shù)據(jù)系統(tǒng),它會通過數(shù)百個攝像頭采集購物用戶的一舉一動,它們團(tuán)隊(duì)的創(chuàng)新為 AWS 旗下的 Kinesis 提供了幫助,該服務(wù)讓用戶能將多個設(shè)備上的流媒體視頻上傳到亞馬遜的云端,對這些數(shù)據(jù)進(jìn)行處理分析就能不斷改進(jìn)自家的機(jī)器學(xué)習(xí)技術(shù)。
即使是還沒用上自家機(jī)器學(xué)習(xí)平臺的亞馬遜服務(wù),也能為這個過程貢獻(xiàn)一份力。眼下,亞馬遜的 Prime Air 無人機(jī)遞送服務(wù)還處在原型階段,由于不能靠云端連接,無人機(jī)必須搭建自己的 AI 系統(tǒng)。不過,它還是從 AI 飛輪上借了不少力,既能從公司其他部門汲取營養(yǎng),又能摸清到底該用什么工具。“在我們看來這就是個菜單,每個人都在分享自己的拿手菜?!盤rime Air 副總裁 Gur Kimchi 說道。同時,他也相信,自己的團(tuán)隊(duì)最終也會有拿手菜貢獻(xiàn)給這份菜單。“我們正在通過問題總結(jié)的經(jīng)驗(yàn)未來肯定會引起其他亞馬遜團(tuán)隊(duì)的興趣?!?/p>
事實(shí)上,這個預(yù)言已經(jīng)開始應(yīng)驗(yàn)了?!叭绻腥嗽诠究吹揭粡垐D片,比如 Prime Air 或 Amazon Go,他們可能就會學(xué)到些什么并打造一個新算法,然后通過公司內(nèi)的討論和交流再結(jié)出新的果實(shí)?!眮嗰R遜機(jī)器人部門首席科學(xué)家 Beth Marcus 說道?!叭缓笪覉F(tuán)隊(duì)中的人就可以用它來解決自己的問題?!?/p>
亞馬遜機(jī)器人部門首席科學(xué)家 Beth Marcus
那么,一個以產(chǎn)品為中心的公司能打敗那些擁有大量深度學(xué)習(xí)大咖的公司嗎?亞馬遜就正在為這個問題驗(yàn)證答案。“盡管它們還處在追趕狀態(tài)中,但發(fā)布的產(chǎn)品可足夠令人驚訝?!監(jiān)ren Etzioni 說道,他是艾倫人工智能研究所 CEO?!八鼈兪羌沂澜缂壍墓荆诖蛟焓澜缂壍?AI 產(chǎn)品?!?/p>
飛輪還在快速旋轉(zhuǎn),還有許多我們不知道的“六張紙”正在積聚力量呢。它們可能會為亞馬遜帶來更多數(shù)據(jù),更多用戶,更好的平臺和更多人才。
“Alexa,亞馬遜在 AI 領(lǐng)域表現(xiàn)如何?”
答案恐怕很簡單,肯定是 Bezos 標(biāo)志性的大笑唄。
Via. Wired,雷鋒網(wǎng)編譯
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。