3
雷鋒網(wǎng)按:如果說到在機(jī)器學(xué)習(xí)領(lǐng)域領(lǐng)先的公司,想必你不會忽略谷歌。從谷歌翻譯到從機(jī)器視覺,谷歌一直努力將機(jī)器學(xué)習(xí)應(yīng)用于可能想象的任何地方。本文會講三個故事,它們在 Google 翻譯向 AI 的成功轉(zhuǎn)型中整合在了一起:一個技術(shù)故事,一個制度故事和一個關(guān)于思想演變的故事。本文源自紐約時報,作者Gideon Lewis-Kraus,雷鋒網(wǎng)編譯,未經(jīng)許可不得轉(zhuǎn)載。
在十一月初的一個周五晚上,東京大學(xué)人機(jī)交互教授 Jun Rekimoto 正在電腦前準(zhǔn)備演講。當(dāng)他在瀏覽網(wǎng)頁時,Rekimoto 突然發(fā)現(xiàn)社交媒體的時間流上出現(xiàn)了一些有意思的內(nèi)容。雖然這些內(nèi)容很輕易就看出是谷歌機(jī)翻的,但質(zhì)量已經(jīng)有了很大的提升。在訪問了 Google Translate 并進(jìn)行測試之后,Rekimoto 驚訝不已。雖然已經(jīng)夜深,但 Google Translate 的進(jìn)展之快依然讓 Rekimoto 久久無法入眠。
隨即,Rekimoto 在他的博客中記下了這一發(fā)現(xiàn)。首先,他在 Google Translate 上輸入了菲茨杰拉德的代表作《了不起的蓋茨比》里的一個英文節(jié)選段落,點(diǎn)擊翻譯后,與兩個日文版本(一個是 1957 年 Takashi Nozaki 的版本,一個是現(xiàn)代 Haruki Murakami 的譯版)進(jìn)行對比。Rekimoto 在和我溝通的一封郵件中提到,Murakami 的譯文帶有強(qiáng)烈的個人風(fēng)格,用語非常細(xì)膩。而谷歌翻譯的版本雖然還帶著機(jī)翻的痕跡,但更加通俗易懂。
隨后,Rekimoto 通過日譯英對 Google Translate 進(jìn)行測試。他把自己口頭翻譯的《乞力馬扎羅的雪》的開頭部分簡單地輸入進(jìn)電腦中,發(fā)現(xiàn)翻譯結(jié)果幾乎可與海明威的原作媲美。當(dāng)然,海明威是以行文通俗易懂聞名的,雷鋒網(wǎng)也請大家來猜猜,哪一段是 Google Translate 所作,哪段是原版文字呢?
NO. 1:
Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai「Ngaje Ngai,」the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.
NO. 2:
Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called「Ngaje Ngai」in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.
即使對于一個美國土著而言,如果不發(fā)現(xiàn) 2 號段落的小小瑕疵,其實很難分辨其中的差別。Rekimoto 表示,其實他對 Google Translate 再熟悉不過了:畢竟在 24 小時前,它只是一個會翻出如下文字的機(jī)器:
Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa. Top of the west,「Ngaje Ngai」in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.
在 Rekimoto 把測試結(jié)果發(fā)在有著一萬多關(guān)注者的 Twitter 后,在短短幾個小時內(nèi),上千人也 po 出了他們「調(diào)戲」機(jī)器翻譯的結(jié)果。有些幾乎完美,而有的則啼笑皆非。
在東京破曉之時,Google Translate 就在這一夜攀上了日本推特的頭條熱搜,甚至把 cult 動畫和人氣偶像少女組合都擠了下去。每個人都在困惑:谷歌翻譯怎么會突然這樣讓我們眼前一亮?
四天之后,全球的上百名記者、企業(yè)家和廣告商蜂擁到谷歌位于倫敦的辦公室中,聆聽谷歌的特別發(fā)布會。賓客們享受著谷歌翻譯 Logo 形狀的小餅干,手中拿的是印有不同國家語言的紙張(我的是挪威語),此外還被邀請下載 Google Translate 的軟件。桌子上的甜甜圈和冰沙都用小牌子標(biāo)注出各種國家的風(fēng)味。過了一會,大家被引到了一個黑暗的小劇場中。
Sundar Pichai,Google CEO
倫敦市長 Sadiq Khan 首先上臺致辭。他以「我有一位朋友」開場,提起對方對他說,市長大人總讓他想起谷歌。市長說,「為啥,因為我什么都懂?」朋友否認(rèn)道,「不是的,是因為你就像谷歌一樣,總是試圖把我的話補(bǔ)完?!箷鰝鞒隽松埔獾男β暋kS后,谷歌 CEO 桑達(dá)爾?皮查伊上臺發(fā)表演講。
皮查伊此行的一項議程是蒞臨慶祝谷歌倫敦國王大道新大樓的建成。此外,基于他在不少場合都宣告谷歌的未來將以「AI 為先」,這句話引來了不少猜想。在他的演講中,皮查伊提到了這句話的真實含義:在未來,谷歌的產(chǎn)品不再是傳統(tǒng)計算編程的結(jié)果,而是「機(jī)器學(xué)習(xí)」。
谷歌大腦——這是谷歌一個鮮少被提及的部門,實際上已經(jīng)成立了五年時間。這個部門一直遵循著一個原理:人工「神經(jīng)網(wǎng)絡(luò)」能夠像嬰兒一樣,通過不斷試錯來理解世界,而這能讓機(jī)器擁有像人類一樣的靈活性。這條圭臬并不是什么新主張——早在上世紀(jì) 40 年代,也就是現(xiàn)代計算機(jī)早期階段就出現(xiàn)了。但少有科學(xué)家將這一想法落地,畢竟它看起來太遙遠(yuǎn)也太神秘了。直到 2011 年,當(dāng)谷歌大腦計劃采用這一方法攻克人工智能,采用機(jī)器學(xué)習(xí)來優(yōu)化谷歌的移動平臺。比如,安卓的語音識別現(xiàn)在已經(jīng)能媲美人類水平;比如,圖像識別也已經(jīng)在一年前首次運(yùn)用于消費(fèi)者產(chǎn)品上。
Google Translate 于 2006 年上線,目前已經(jīng)成為谷歌最受信賴及流行的應(yīng)用之一。每天,Google Translate 會面對 5 億個月度活躍用戶的 1400 億個不同語種的單詞。它不僅僅是作為一個獨(dú)立應(yīng)用而存在,而且作為 Gmail、Chrome 及許多其它谷歌產(chǎn)品的集成功能,我們將它作為一個按鈕——一個毫無障礙、非常自然的電子組成方式。皮查伊在臺上提及,直至敘利亞難民危機(jī)之時,公司才意識地區(qū)間的翻譯交流是何等重要。在他背后的屏幕顯示,在那段敏感時期,阿拉伯語與德語互譯的谷歌翻譯請求增長了五倍之多。(這也與皮查伊的想法一致,他在印度出生成長,而雷鋒網(wǎng)要指出的一點(diǎn)是,印度是一個多語種國家。)谷歌翻譯在此后也已經(jīng)在穩(wěn)定增加語種的豐富性,并完善功能,但在過去四年來,質(zhì)量提升的速度已經(jīng)大不如前。
直至如今。上個周末,雷鋒網(wǎng)也提及了 Google Translate 的大更新,系統(tǒng)已經(jīng)將大部分請求轉(zhuǎn)換到基于人工智能的系統(tǒng)進(jìn)行處理。這一更新在美國、歐洲和亞洲都已經(jīng)上線,包括西班牙語、葡萄牙語、法語、德語、中文、日語、韓語及土耳其語在內(nèi)的語言,都可以實現(xiàn)與英語的互譯。而其它上百種語言也在緊鑼密鼓地更新中,以每月預(yù)期八個的速度計劃在年底前更新完畢。而對于谷歌工程師而言最大的驚喜在于,他們只用了九個月時間就提前完成了。A.I. 系統(tǒng)所取得的進(jìn)展速度之快,大概就相當(dāng)于在一夜間掌握了以往技術(shù)的總和。
皮查伊對于含蓄的古典文學(xué)尤為著迷,一個月前,他曾告訴我,在他山景城的辦公室里發(fā)表演講時,PPT 上有些文字還是需要 Google Translate 來輔助顯示,畢竟并不是所有人都像物理學(xué)家 Robert Oppenheimer 一樣能讀原版的《博伽梵歌》(雷鋒網(wǎng)注:印度圣典,由梵語寫就)。因此在倫敦的發(fā)布會上,幻燈片上出現(xiàn)了博爾赫斯的經(jīng)典名言:「Uno no es lo que es por lo que escribe, sino por lo que ha leído.」(評判一個人不應(yīng)看他所寫,而應(yīng)看他所讀。)
帶著微笑,皮查伊大聲地讀著由舊的 Google Translate 展示的令人有些尷尬的直譯版本:「One is not what is for what he writes, but for what he has read.」
而在大屏幕的右邊,新版的 A.I. 系統(tǒng)版本則展示了一個更加信達(dá)雅的譯文:「You are not what you write, but what you have read.」
這句話用來描述新版的 Google Translate,卻也恰如其分:在某種意義上,Google Translate 的確是第一臺通過「飽讀詩書」而通曉知識的機(jī)器。
谷歌決定圍繞 A.I. 而重組公司,實際上是全球機(jī)器學(xué)習(xí)熱潮的第一批擁躉。在過去的四年里,谷歌、Facebook、蘋果、亞馬遜、微軟及中國的百度,這六家公司都圍繞人工智能展開了一場聲勢浩大的「人」備競賽,而大學(xué)自然成為了兵家必爭之地。企業(yè)紛紛向頂尖的學(xué)術(shù)院系拋出橄欖枝,許以極大的資源和自由。比如硅谷眾人皆知 Facebook 惜才如命,CEO 小扎會親自通過視頻和電話來了解公司即將納入麾下的優(yōu)秀研究生,七位數(shù)的年薪起跳根本不在話下。而參加人工智能的相關(guān)學(xué)術(shù)會議的人士幾乎增加了四倍??萍季揞^們在關(guān)心的,不僅僅是小打小鬧的技術(shù)進(jìn)步,而是如何掌控接下來即將來臨的計算平臺:普適性極強(qiáng)、無處不在的人工智能。
「人工智能」這個詞似乎總是出現(xiàn)得這么理所當(dāng)然,但實際上它一直是引起混亂和爭議的源頭。想象你正置身上個世紀(jì) 70 年代,在路上攔住了隨便什么人,掏出了一個智能手機(jī)并向她展示里面的 Google 地圖。如果你嘗試說服她,你不是什么奇怪巫師,而你拿出的「黑色護(hù)身符」也只是一個比阿波羅時光機(jī)更為強(qiáng)大的微型電腦,谷歌地圖實際上毫無疑問,就是一個能向她展示什么是「人工智能」的東西。的確如此,這個應(yīng)用能夠為你制定更棒的路線,比如從酒店到機(jī)場——顯然,機(jī)器能比你做得更快更好,此外,它還能對交通進(jìn)行評判,規(guī)劃最佳路線,并當(dāng)你「誤入歧途」時,重新判斷你的位置并推薦新的路線。
實際上,今天沒有人會把谷歌地圖與「高貴的」人工智能相提并論。當(dāng)我們在使用智能這個詞的時候,是帶著情感色彩的。我們所理解的人工智能,是能與其它初級簡單的事物所能完成的東西不同的?,F(xiàn)在,我們能用自動化完成一項任務(wù),那么所涉及的相關(guān)技能就會降級為一種單純的機(jī)制。而今天的谷歌地圖,似乎還不能對應(yīng)上我們所想象的「人工智能」這個詞,而只能充其量叫作「機(jī)器」(robotic):只接受一個明確的請求(從某處到另一處),并盡力滿足這個需求。因此,人工智能這個詞所能對應(yīng)的實際工作已經(jīng)在縮小。
皮查伊將目前的人工智能應(yīng)用與「通用人工智能」這個終極 boss 區(qū)分開來。后者不會涉及具體的指令,而將是一個通用工具,為一般情況下的一般用途而設(shè)計。皮查伊認(rèn)為,公司未來的運(yùn)轉(zhuǎn)將主要依賴通用人工智能。想象一下,如果你告訴谷歌地圖,「我要去機(jī)場,但我中途要停下來為我侄子買個禮物,」一個通用版本的人工智能服務(wù)——就像三年前的電影《Her》中,斯嘉麗?約翰遜所配音的那個無所不在的助手一樣。她能夠像你的親密朋友一樣,知道你的一些基本情況:侄子的年齡、喜歡給孩子買什么、哪能找到一個購物商店。但一個真正智能的地圖也能做一些親密朋友所考慮不到的事情,比如你侄子的學(xué)校里,孩子們最近最時髦玩些什么。一個智能的機(jī)器能夠通過錯綜復(fù)雜的數(shù)據(jù)抽絲剝繭,并尋找出那些甚至我們自己都渾然不知的需求。
人工智能的新浪潮,也就是 AI 助手——就像蘋果的 Siri、Facebook 的 M 及亞馬遜的 Echo,都是機(jī)器學(xué)習(xí)的產(chǎn)物,作用大同小異。這些公司在消費(fèi)者身上做著機(jī)器學(xué)習(xí)之夢,但是機(jī)器學(xué)習(xí)并不一定只局限在消費(fèi)者身上。三星的醫(yī)學(xué)影像子公司今年宣布,其新款的超聲設(shè)備能夠檢測乳腺癌,而管理層也在努力增加人員貯備,以擴(kuò)大計算機(jī)的行業(yè)應(yīng)用。DeepMind 在 2014 年被谷歌納入麾下,雖然當(dāng)時的預(yù)測顯示,人工智能在十年后才能戰(zhàn)勝人類,但 3 月份,AlphaGo 就以 4:1 戰(zhàn)勝了圍棋大師李世石。
1950 年,艾倫?圖靈提出的測試指出,計算機(jī)如果能在五分鐘的文本交流中成功欺騙一個人類對話者,那么就算測試成功。是否機(jī)器能在兩種語言中自由切換,并能很好地理解人類的語言進(jìn)行對話?谷歌大腦的成員們正在推動和幫助監(jiān)督 Translate 項目,滿懷信心地相信這樣的機(jī)器能夠成為未來的一位通用人工智能助手。
接下來雷鋒網(wǎng)要展示的,就是 Google 的研究人員和工程師們(剛開始只有一兩個人,后來變成三四個,最后成長到了上百個)沿著這一方向取得巨大進(jìn)步的故事了。這是一個非常少見的故事,尤其是因為它與我們慣常對硅谷的印象相悖。這個故事里面,沒有那種在車庫里搗鼓一些東西,認(rèn)為自己可以改變世界的人。它不是一個關(guān)于科技解決所有問題的故事,也不是一個關(guān)于技術(shù)會導(dǎo)致世界毀滅的故事。它也與顛覆無關(guān),至少不是我們通常認(rèn)為的那種顛覆。
事實上,里面有三個重疊的故事,它們在 Google 翻譯向 AI 的成功轉(zhuǎn)型中整合在了一起:一個技術(shù)故事,一個制度故事和一個關(guān)于思想演變的故事。
技術(shù)故事與一個公司專注于一個產(chǎn)品的團(tuán)隊有關(guān),在這里他們只用了別人四分之一的時間,對一個舊產(chǎn)品進(jìn)行了改進(jìn)和測試,并形成了全新的版本。
制度故事與公司內(nèi)一個小而有影響力的人工智能團(tuán)隊有關(guān),他們對一些古老、未經(jīng)證實和廣泛不適用的計算概念出于直覺的信念,顛覆了幾乎每一家公司。
思想的故事與一些長期堅持不懈的認(rèn)知科學(xué)家、心理學(xué)家和工程師有關(guān),他們看似不合理的信念,最終激起了我們對技術(shù)以及意識本身理解上的范式的轉(zhuǎn)變。
第一個故事是 Google Translate 的故事,它發(fā)生在山景城的九個月時間里,解釋了機(jī)器翻譯的轉(zhuǎn)變。第二個故事是谷歌大腦的故事。第三個故事是深度學(xué)習(xí)的故事,它發(fā)生在蘇格蘭、瑞士、日本、加拿大等地遙遠(yuǎn)的實驗室,時間跨度七十多年,它甚至改變了我們對那個會思考的自我的認(rèn)知。
這三個故事都與人工智能有關(guān)。七十年的故事與我們對人工智能的期待與渴望有關(guān),二十五年的故事與它在近期可以做什么有關(guān),而那個九個月的故事則與它現(xiàn)在能做什么有關(guān)。這三個故事都是對概念的驗證,而所有的一切都只是開始。
以上是全文第一部分,敬請期待雷鋒網(wǎng)的后續(xù)文章。
via NewYork Times
【招聘】雷鋒網(wǎng)堅持在人工智能、無人駕駛、VR/AR、Fintech、未來醫(yī)療等領(lǐng)域第一時間提供海外科技動態(tài)與資訊。我們需要若干關(guān)注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。
簡歷投遞至 wudexin@leiphone.com,工作地 北京。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。