3
本文作者: 奕欣 | 2016-12-16 07:25 |
雷鋒網(wǎng)按:如果說到在機(jī)器學(xué)習(xí)領(lǐng)域領(lǐng)先的公司,想必你不會(huì)忽略谷歌。從谷歌翻譯到從機(jī)器視覺,谷歌一直努力將機(jī)器學(xué)習(xí)應(yīng)用于可能想象的任何地方。本文會(huì)講三個(gè)故事,它們?cè)?Google 翻譯向 AI 的成功轉(zhuǎn)型中整合在了一起:一個(gè)技術(shù)故事,一個(gè)制度故事和一個(gè)關(guān)于思想演變的故事。本文源自紐約時(shí)報(bào),作者Gideon Lewis-Kraus,雷鋒網(wǎng)編譯,未經(jīng)許可不得轉(zhuǎn)載。
在十一月初的一個(gè)周五晚上,東京大學(xué)人機(jī)交互教授 Jun Rekimoto 正在電腦前準(zhǔn)備演講。當(dāng)他在瀏覽網(wǎng)頁時(shí),Rekimoto 突然發(fā)現(xiàn)社交媒體的時(shí)間流上出現(xiàn)了一些有意思的內(nèi)容。雖然這些內(nèi)容很輕易就看出是谷歌機(jī)翻的,但質(zhì)量已經(jīng)有了很大的提升。在訪問了 Google Translate 并進(jìn)行測(cè)試之后,Rekimoto 驚訝不已。雖然已經(jīng)夜深,但 Google Translate 的進(jìn)展之快依然讓 Rekimoto 久久無法入眠。
隨即,Rekimoto 在他的博客中記下了這一發(fā)現(xiàn)。首先,他在 Google Translate 上輸入了菲茨杰拉德的代表作《了不起的蓋茨比》里的一個(gè)英文節(jié)選段落,點(diǎn)擊翻譯后,與兩個(gè)日文版本(一個(gè)是 1957 年 Takashi Nozaki 的版本,一個(gè)是現(xiàn)代 Haruki Murakami 的譯版)進(jìn)行對(duì)比。Rekimoto 在和我溝通的一封郵件中提到,Murakami 的譯文帶有強(qiáng)烈的個(gè)人風(fēng)格,用語非常細(xì)膩。而谷歌翻譯的版本雖然還帶著機(jī)翻的痕跡,但更加通俗易懂。
隨后,Rekimoto 通過日譯英對(duì) Google Translate 進(jìn)行測(cè)試。他把自己口頭翻譯的《乞力馬扎羅的雪》的開頭部分簡(jiǎn)單地輸入進(jìn)電腦中,發(fā)現(xiàn)翻譯結(jié)果幾乎可與海明威的原作媲美。當(dāng)然,海明威是以行文通俗易懂聞名的,雷鋒網(wǎng)也請(qǐng)大家來猜猜,哪一段是 Google Translate 所作,哪段是原版文字呢?
NO. 1:
Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai「Ngaje Ngai,」the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.
NO. 2:
Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called「Ngaje Ngai」in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.
即使對(duì)于一個(gè)美國土著而言,如果不發(fā)現(xiàn) 2 號(hào)段落的小小瑕疵,其實(shí)很難分辨其中的差別。Rekimoto 表示,其實(shí)他對(duì) Google Translate 再熟悉不過了:畢竟在 24 小時(shí)前,它只是一個(gè)會(huì)翻出如下文字的機(jī)器:
Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa. Top of the west,「Ngaje Ngai」in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.
在 Rekimoto 把測(cè)試結(jié)果發(fā)在有著一萬多關(guān)注者的 Twitter 后,在短短幾個(gè)小時(shí)內(nèi),上千人也 po 出了他們「調(diào)戲」機(jī)器翻譯的結(jié)果。有些幾乎完美,而有的則啼笑皆非。
在東京破曉之時(shí),Google Translate 就在這一夜攀上了日本推特的頭條熱搜,甚至把 cult 動(dòng)畫和人氣偶像少女組合都擠了下去。每個(gè)人都在困惑:谷歌翻譯怎么會(huì)突然這樣讓我們眼前一亮?
四天之后,全球的上百名記者、企業(yè)家和廣告商蜂擁到谷歌位于倫敦的辦公室中,聆聽谷歌的特別發(fā)布會(huì)。賓客們享受著谷歌翻譯 Logo 形狀的小餅干,手中拿的是印有不同國家語言的紙張(我的是挪威語),此外還被邀請(qǐng)下載 Google Translate 的軟件。桌子上的甜甜圈和冰沙都用小牌子標(biāo)注出各種國家的風(fēng)味。過了一會(huì),大家被引到了一個(gè)黑暗的小劇場(chǎng)中。
Sundar Pichai,Google CEO
倫敦市長 Sadiq Khan 首先上臺(tái)致辭。他以「我有一位朋友」開場(chǎng),提起對(duì)方對(duì)他說,市長大人總讓他想起谷歌。市長說,「為啥,因?yàn)槲沂裁炊级??」朋友否認(rèn)道,「不是的,是因?yàn)槟憔拖窆雀枰粯?,總是試圖把我的話補(bǔ)完?!箷?huì)場(chǎng)傳出了善意的笑聲。隨后,谷歌 CEO 桑達(dá)爾?皮查伊上臺(tái)發(fā)表演講。
皮查伊此行的一項(xiàng)議程是蒞臨慶祝谷歌倫敦國王大道新大樓的建成。此外,基于他在不少場(chǎng)合都宣告谷歌的未來將以「AI 為先」,這句話引來了不少猜想。在他的演講中,皮查伊提到了這句話的真實(shí)含義:在未來,谷歌的產(chǎn)品不再是傳統(tǒng)計(jì)算編程的結(jié)果,而是「機(jī)器學(xué)習(xí)」。
谷歌大腦——這是谷歌一個(gè)鮮少被提及的部門,實(shí)際上已經(jīng)成立了五年時(shí)間。這個(gè)部門一直遵循著一個(gè)原理:人工「神經(jīng)網(wǎng)絡(luò)」能夠像嬰兒一樣,通過不斷試錯(cuò)來理解世界,而這能讓機(jī)器擁有像人類一樣的靈活性。這條圭臬并不是什么新主張——早在上世紀(jì) 40 年代,也就是現(xiàn)代計(jì)算機(jī)早期階段就出現(xiàn)了。但少有科學(xué)家將這一想法落地,畢竟它看起來太遙遠(yuǎn)也太神秘了。直到 2011 年,當(dāng)谷歌大腦計(jì)劃采用這一方法攻克人工智能,采用機(jī)器學(xué)習(xí)來優(yōu)化谷歌的移動(dòng)平臺(tái)。比如,安卓的語音識(shí)別現(xiàn)在已經(jīng)能媲美人類水平;比如,圖像識(shí)別也已經(jīng)在一年前首次運(yùn)用于消費(fèi)者產(chǎn)品上。
Google Translate 于 2006 年上線,目前已經(jīng)成為谷歌最受信賴及流行的應(yīng)用之一。每天,Google Translate 會(huì)面對(duì) 5 億個(gè)月度活躍用戶的 1400 億個(gè)不同語種的單詞。它不僅僅是作為一個(gè)獨(dú)立應(yīng)用而存在,而且作為 Gmail、Chrome 及許多其它谷歌產(chǎn)品的集成功能,我們將它作為一個(gè)按鈕——一個(gè)毫無障礙、非常自然的電子組成方式。皮查伊在臺(tái)上提及,直至敘利亞難民危機(jī)之時(shí),公司才意識(shí)地區(qū)間的翻譯交流是何等重要。在他背后的屏幕顯示,在那段敏感時(shí)期,阿拉伯語與德語互譯的谷歌翻譯請(qǐng)求增長了五倍之多。(這也與皮查伊的想法一致,他在印度出生成長,而雷鋒網(wǎng)要指出的一點(diǎn)是,印度是一個(gè)多語種國家。)谷歌翻譯在此后也已經(jīng)在穩(wěn)定增加語種的豐富性,并完善功能,但在過去四年來,質(zhì)量提升的速度已經(jīng)大不如前。
直至如今。上個(gè)周末,雷鋒網(wǎng)也提及了 Google Translate 的大更新,系統(tǒng)已經(jīng)將大部分請(qǐng)求轉(zhuǎn)換到基于人工智能的系統(tǒng)進(jìn)行處理。這一更新在美國、歐洲和亞洲都已經(jīng)上線,包括西班牙語、葡萄牙語、法語、德語、中文、日語、韓語及土耳其語在內(nèi)的語言,都可以實(shí)現(xiàn)與英語的互譯。而其它上百種語言也在緊鑼密鼓地更新中,以每月預(yù)期八個(gè)的速度計(jì)劃在年底前更新完畢。而對(duì)于谷歌工程師而言最大的驚喜在于,他們只用了九個(gè)月時(shí)間就提前完成了。A.I. 系統(tǒng)所取得的進(jìn)展速度之快,大概就相當(dāng)于在一夜間掌握了以往技術(shù)的總和。
皮查伊對(duì)于含蓄的古典文學(xué)尤為著迷,一個(gè)月前,他曾告訴我,在他山景城的辦公室里發(fā)表演講時(shí),PPT 上有些文字還是需要 Google Translate 來輔助顯示,畢竟并不是所有人都像物理學(xué)家 Robert Oppenheimer 一樣能讀原版的《博伽梵歌》(雷鋒網(wǎng)注:印度圣典,由梵語寫就)。因此在倫敦的發(fā)布會(huì)上,幻燈片上出現(xiàn)了博爾赫斯的經(jīng)典名言:「Uno no es lo que es por lo que escribe, sino por lo que ha leído.」(評(píng)判一個(gè)人不應(yīng)看他所寫,而應(yīng)看他所讀。)
帶著微笑,皮查伊大聲地讀著由舊的 Google Translate 展示的令人有些尷尬的直譯版本:「One is not what is for what he writes, but for what he has read.」
而在大屏幕的右邊,新版的 A.I. 系統(tǒng)版本則展示了一個(gè)更加信達(dá)雅的譯文:「You are not what you write, but what you have read.」
這句話用來描述新版的 Google Translate,卻也恰如其分:在某種意義上,Google Translate 的確是第一臺(tái)通過「飽讀詩書」而通曉知識(shí)的機(jī)器。
谷歌決定圍繞 A.I. 而重組公司,實(shí)際上是全球機(jī)器學(xué)習(xí)熱潮的第一批擁躉。在過去的四年里,谷歌、Facebook、蘋果、亞馬遜、微軟及中國的百度,這六家公司都圍繞人工智能展開了一場(chǎng)聲勢(shì)浩大的「人」備競(jìng)賽,而大學(xué)自然成為了兵家必爭(zhēng)之地。企業(yè)紛紛向頂尖的學(xué)術(shù)院系拋出橄欖枝,許以極大的資源和自由。比如硅谷眾人皆知 Facebook 惜才如命,CEO 小扎會(huì)親自通過視頻和電話來了解公司即將納入麾下的優(yōu)秀研究生,七位數(shù)的年薪起跳根本不在話下。而參加人工智能的相關(guān)學(xué)術(shù)會(huì)議的人士幾乎增加了四倍。科技巨頭們?cè)陉P(guān)心的,不僅僅是小打小鬧的技術(shù)進(jìn)步,而是如何掌控接下來即將來臨的計(jì)算平臺(tái):普適性極強(qiáng)、無處不在的人工智能。
「人工智能」這個(gè)詞似乎總是出現(xiàn)得這么理所當(dāng)然,但實(shí)際上它一直是引起混亂和爭(zhēng)議的源頭。想象你正置身上個(gè)世紀(jì) 70 年代,在路上攔住了隨便什么人,掏出了一個(gè)智能手機(jī)并向她展示里面的 Google 地圖。如果你嘗試說服她,你不是什么奇怪巫師,而你拿出的「黑色護(hù)身符」也只是一個(gè)比阿波羅時(shí)光機(jī)更為強(qiáng)大的微型電腦,谷歌地圖實(shí)際上毫無疑問,就是一個(gè)能向她展示什么是「人工智能」的東西。的確如此,這個(gè)應(yīng)用能夠?yàn)槟阒贫ǜ舻穆肪€,比如從酒店到機(jī)場(chǎng)——顯然,機(jī)器能比你做得更快更好,此外,它還能對(duì)交通進(jìn)行評(píng)判,規(guī)劃最佳路線,并當(dāng)你「誤入歧途」時(shí),重新判斷你的位置并推薦新的路線。
實(shí)際上,今天沒有人會(huì)把谷歌地圖與「高貴的」人工智能相提并論。當(dāng)我們?cè)谑褂弥悄苓@個(gè)詞的時(shí)候,是帶著情感色彩的。我們所理解的人工智能,是能與其它初級(jí)簡(jiǎn)單的事物所能完成的東西不同的?,F(xiàn)在,我們能用自動(dòng)化完成一項(xiàng)任務(wù),那么所涉及的相關(guān)技能就會(huì)降級(jí)為一種單純的機(jī)制。而今天的谷歌地圖,似乎還不能對(duì)應(yīng)上我們所想象的「人工智能」這個(gè)詞,而只能充其量叫作「機(jī)器」(robotic):只接受一個(gè)明確的請(qǐng)求(從某處到另一處),并盡力滿足這個(gè)需求。因此,人工智能這個(gè)詞所能對(duì)應(yīng)的實(shí)際工作已經(jīng)在縮小。
皮查伊將目前的人工智能應(yīng)用與「通用人工智能」這個(gè)終極 boss 區(qū)分開來。后者不會(huì)涉及具體的指令,而將是一個(gè)通用工具,為一般情況下的一般用途而設(shè)計(jì)。皮查伊認(rèn)為,公司未來的運(yùn)轉(zhuǎn)將主要依賴通用人工智能。想象一下,如果你告訴谷歌地圖,「我要去機(jī)場(chǎng),但我中途要停下來為我侄子買個(gè)禮物,」一個(gè)通用版本的人工智能服務(wù)——就像三年前的電影《Her》中,斯嘉麗?約翰遜所配音的那個(gè)無所不在的助手一樣。她能夠像你的親密朋友一樣,知道你的一些基本情況:侄子的年齡、喜歡給孩子買什么、哪能找到一個(gè)購物商店。但一個(gè)真正智能的地圖也能做一些親密朋友所考慮不到的事情,比如你侄子的學(xué)校里,孩子們最近最時(shí)髦玩些什么。一個(gè)智能的機(jī)器能夠通過錯(cuò)綜復(fù)雜的數(shù)據(jù)抽絲剝繭,并尋找出那些甚至我們自己都渾然不知的需求。
人工智能的新浪潮,也就是 AI 助手——就像蘋果的 Siri、Facebook 的 M 及亞馬遜的 Echo,都是機(jī)器學(xué)習(xí)的產(chǎn)物,作用大同小異。這些公司在消費(fèi)者身上做著機(jī)器學(xué)習(xí)之夢(mèng),但是機(jī)器學(xué)習(xí)并不一定只局限在消費(fèi)者身上。三星的醫(yī)學(xué)影像子公司今年宣布,其新款的超聲設(shè)備能夠檢測(cè)乳腺癌,而管理層也在努力增加人員貯備,以擴(kuò)大計(jì)算機(jī)的行業(yè)應(yīng)用。DeepMind 在 2014 年被谷歌納入麾下,雖然當(dāng)時(shí)的預(yù)測(cè)顯示,人工智能在十年后才能戰(zhàn)勝人類,但 3 月份,AlphaGo 就以 4:1 戰(zhàn)勝了圍棋大師李世石。
1950 年,艾倫?圖靈提出的測(cè)試指出,計(jì)算機(jī)如果能在五分鐘的文本交流中成功欺騙一個(gè)人類對(duì)話者,那么就算測(cè)試成功。是否機(jī)器能在兩種語言中自由切換,并能很好地理解人類的語言進(jìn)行對(duì)話?谷歌大腦的成員們正在推動(dòng)和幫助監(jiān)督 Translate 項(xiàng)目,滿懷信心地相信這樣的機(jī)器能夠成為未來的一位通用人工智能助手。
接下來雷鋒網(wǎng)要展示的,就是 Google 的研究人員和工程師們(剛開始只有一兩個(gè)人,后來變成三四個(gè),最后成長到了上百個(gè))沿著這一方向取得巨大進(jìn)步的故事了。這是一個(gè)非常少見的故事,尤其是因?yàn)樗c我們慣常對(duì)硅谷的印象相悖。這個(gè)故事里面,沒有那種在車庫里搗鼓一些東西,認(rèn)為自己可以改變世界的人。它不是一個(gè)關(guān)于科技解決所有問題的故事,也不是一個(gè)關(guān)于技術(shù)會(huì)導(dǎo)致世界毀滅的故事。它也與顛覆無關(guān),至少不是我們通常認(rèn)為的那種顛覆。
事實(shí)上,里面有三個(gè)重疊的故事,它們?cè)?Google 翻譯向 AI 的成功轉(zhuǎn)型中整合在了一起:一個(gè)技術(shù)故事,一個(gè)制度故事和一個(gè)關(guān)于思想演變的故事。
技術(shù)故事與一個(gè)公司專注于一個(gè)產(chǎn)品的團(tuán)隊(duì)有關(guān),在這里他們只用了別人四分之一的時(shí)間,對(duì)一個(gè)舊產(chǎn)品進(jìn)行了改進(jìn)和測(cè)試,并形成了全新的版本。
制度故事與公司內(nèi)一個(gè)小而有影響力的人工智能團(tuán)隊(duì)有關(guān),他們對(duì)一些古老、未經(jīng)證實(shí)和廣泛不適用的計(jì)算概念出于直覺的信念,顛覆了幾乎每一家公司。
思想的故事與一些長期堅(jiān)持不懈的認(rèn)知科學(xué)家、心理學(xué)家和工程師有關(guān),他們看似不合理的信念,最終激起了我們對(duì)技術(shù)以及意識(shí)本身理解上的范式的轉(zhuǎn)變。
第一個(gè)故事是 Google Translate 的故事,它發(fā)生在山景城的九個(gè)月時(shí)間里,解釋了機(jī)器翻譯的轉(zhuǎn)變。第二個(gè)故事是谷歌大腦的故事。第三個(gè)故事是深度學(xué)習(xí)的故事,它發(fā)生在蘇格蘭、瑞士、日本、加拿大等地遙遠(yuǎn)的實(shí)驗(yàn)室,時(shí)間跨度七十多年,它甚至改變了我們對(duì)那個(gè)會(huì)思考的自我的認(rèn)知。
這三個(gè)故事都與人工智能有關(guān)。七十年的故事與我們對(duì)人工智能的期待與渴望有關(guān),二十五年的故事與它在近期可以做什么有關(guān),而那個(gè)九個(gè)月的故事則與它現(xiàn)在能做什么有關(guān)。這三個(gè)故事都是對(duì)概念的驗(yàn)證,而所有的一切都只是開始。
以上是全文第一部分,敬請(qǐng)期待雷鋒網(wǎng)的后續(xù)文章。
via NewYork Times
【招聘】雷鋒網(wǎng)堅(jiān)持在人工智能、無人駕駛、VR/AR、Fintech、未來醫(yī)療等領(lǐng)域第一時(shí)間提供海外科技動(dòng)態(tài)與資訊。我們需要若干關(guān)注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。
簡(jiǎn)歷投遞至 wudexin@leiphone.com,工作地 北京。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。