0
雷鋒網(wǎng) AI 科技評論按:年終總結(jié)可能會遲到,但不會缺席!
圣誕節(jié)+元旦假期過后,谷歌資深 Fellow、谷歌 AI 負(fù)責(zé)人 Jeff Dean 代表所有谷歌的研究部門發(fā)出了他們的 2018 年度科研研究年終總結(jié)。這一年,谷歌的科研人員們在人工智能、量子計算、計算圖形學(xué)、算法理論、軟件系統(tǒng)、TPU、開源軟件與數(shù)據(jù)集、機器人技術(shù)、AI 應(yīng)用、醫(yī)療保健等許多方面做出了許多新的成果,不僅有許多論文,更有許多實際的技術(shù)產(chǎn)品。雷鋒網(wǎng) AI 科技評論在 2018 年中也曾單獨報道過其中的許多項目。
同樣由 Jeff Dean 撰寫的 2017 年谷歌大腦年終總結(jié)見這里 上篇 下篇。如今谷歌把人工智能的相關(guān)研究開發(fā)拓展到了新品牌「谷歌 AI」下面,曾經(jīng)的谷歌大腦負(fù)責(zé)人 Jeff Dean 也就成為了谷歌 AI 的負(fù)責(zé)人。
現(xiàn)在我們把這篇 Jeff Dean 代表全體谷歌科研人員撰寫的谷歌科研成果 2018 年年終總結(jié)全文翻譯如下。
對于谷歌的研究團隊來說,2018 年又是充滿激情和干勁的一年。我們的技術(shù)研究成果在許多個不同的方向上繼續(xù)開花結(jié)果,包括計算機科學(xué)方面的基礎(chǔ)科研成果和論文、科研結(jié)果在谷歌的更多新興方向中的應(yīng)用(比如醫(yī)療保健和機器人)、對開源軟件的貢獻以及和谷歌的產(chǎn)品開發(fā)團隊之間的緊密協(xié)作,所有這些的目標(biāo)都是為了創(chuàng)建更多有用的工具和服務(wù)。下面我們來一起看看 2018 的一些成果,以及對未來的一年做一些展望。更詳細(xì)盡的匯總可以參見我們的 2018 年論文發(fā)表清單(https://ai.google/research/pubs/?year=2018)。
在過去的幾年中,我們共同見證了 AI 領(lǐng)域的重大進步,欣喜地看到了 AI 對谷歌的產(chǎn)品產(chǎn)生了積極的影響,這些產(chǎn)品也在日常生活中為谷歌的數(shù)十億用戶提供了更多幫助。對于我們這些在 AI 領(lǐng)域工作的人來說,我們非常在意 AI 是否成為了這個世界變得更好的推動力 —— 也就是說,它的使用是符合人類道德的,它用來解決的問題也是對這個社會有益的。2018 年我們發(fā)布了谷歌 AI 準(zhǔn)則,它也帶有一系列負(fù)責(zé)任的 AI 應(yīng)用的示范樣本,描繪出了 AI 應(yīng)用實踐的技術(shù)指導(dǎo)。這些準(zhǔn)則和示范也一同構(gòu)成了評價我們谷歌自己的 AI 產(chǎn)品開發(fā)的體系框架,我們希望別的組織機構(gòu)也能夠運用這些準(zhǔn)則規(guī)范他們自己的思路。需要說明的是,由于這個領(lǐng)域的發(fā)展速度飛快,我們在某些準(zhǔn)則下提供的示范樣本(比如「為了避免產(chǎn)生和加強不公平的偏見」、「為了對人類可解釋」),也會隨著我們在機器學(xué)習(xí)公平性和模型可解釋性等新領(lǐng)域開展研究而不斷變化、不斷更新。這些研究研究成果反過來也會讓谷歌的產(chǎn)品不斷進步,讓它們更具包容性、更少帶有偏倚,比如我們就已經(jīng)減少了谷歌翻譯中的性別偏倚,也探索并發(fā)布了內(nèi)容更為廣泛多樣的圖像數(shù)據(jù)集和模型(https://ai.google/tools/datasets/open-images-extended-crowdsourced/),以便讓計算機視覺模型在整個地球中更加多樣化的環(huán)境中都可以工作。更進一步地,這些努力也讓我們得以把最佳實踐分享給更廣泛的研究群體,比如我們的機器學(xué)習(xí)快速課程中的 Fairness Module。
如今大家都已經(jīng)知道,在社會的許多方面、在許多重要的社會問題上,AI 都有潛力帶來劇烈的影響。我們在 AI 洪水預(yù)測方面的研究就是一個絕佳的例子,它展示了 AI 可以如何在真實世界的問題上幫助人類。在多個谷歌內(nèi)部團隊的合作下,這項研究的目標(biāo)被定義為「為洪水發(fā)生的可能性和可能覆蓋地區(qū)提供準(zhǔn)確、細(xì)時間粒度的信息」,而那些在洪水高危地區(qū)生活的人們就可以根據(jù)這些信息作出更好、更及時的判斷,能更好地保護自己、保護自己的財產(chǎn)。
另一個例子是我們研究如何預(yù)測地震的余震,我們展示了機器學(xué)習(xí)模型預(yù)測余震地址可以比傳統(tǒng)的基于物理模型的方法準(zhǔn)確得多。這項研究還有一個也許影響更為深遠(yuǎn)的方面,那就是因為我們設(shè)計的機器學(xué)習(xí)模型是具備可解釋性的,科學(xué)家們得以在這個模型的幫助下對余震的活動作出更好的觀察,這不僅讓余震的預(yù)測變得更加準(zhǔn)確,也讓我們對余震本身有了更好的了解。
谷歌之外也有許多我們的伙伴。許多研究者和谷歌的研究員、工程師一起借助 TensorFlow 之類的開源軟件鉆研各種各樣的科學(xué)和社會學(xué)問題,比如用 CNN 識別座頭鯨的聲音,發(fā)現(xiàn)新的系外行星,識別生病的木薯等等。
為了鼓勵這個領(lǐng)域產(chǎn)生更多的新點子,我們與 Google.org 一同發(fā)起了「谷歌 AI 社會影響競賽」,參加比賽的個人和組織研究需要一些從想法轉(zhuǎn)化為現(xiàn)實之后可能會帶來重大社會影響的項目,然后他們可以獲得總數(shù)為 2500 萬美元的資助資金,而且可以獲得谷歌研究科學(xué)家、工程師、其它專家的指導(dǎo)。
在我們圍繞機器學(xué)習(xí)和計算機科學(xué)展開的研究中,有很大一部分都是希望幫助我們的用戶們更快、更高效地達到他們的目標(biāo)。通常這都需要科研團隊和各種產(chǎn)品團隊之間展開合作,研究成果也發(fā)布成為各種各樣的產(chǎn)品功能和設(shè)置。其中一個例子是谷歌 Duplex,這個系統(tǒng)的建設(shè)需要我們把自然語言處理、對話理解、語音識別、文本轉(zhuǎn)語音、用戶理解以及高效的用戶界面 UI 設(shè)計多個方面的研究成果集中整合,而它的最終效果是,只需要用戶對著自己的手機詢問「能不能幫我預(yù)定明天下午 4 點做頭發(fā)」,一個虛擬助手就會替你打電話到理發(fā)店敲定相關(guān)的細(xì)節(jié)。
我還可以舉一些例子,比如智能寫作 Smart Compose,這個工具會通過預(yù)測模型給出寫作提示,幫助用戶寫作郵件,寫作過程可以更快、更輕松;聲音搜索 Sound Search,它構(gòu)建在 Now Playing 功能的基礎(chǔ)上,可以快速、準(zhǔn)確地幫助用戶找到環(huán)境中正在播放的音樂;還有安卓系統(tǒng)中的 Smart Linkify,它展示了我們可以使用運行在移動設(shè)備上的機器學(xué)習(xí)模型分析屏幕上正在顯示的文本,理解文本內(nèi)容之后把它劃分為不同種類的小節(jié),接著就可以直接點擊文本訪問對應(yīng)的應(yīng)用程序。
Smart Linkify 智能地把連續(xù)的文本分成了一段地址 + 一個時間
我們目前的研究中一個重要的關(guān)注點就是讓谷歌助手這樣的工具支持更多的語言,以及讓系統(tǒng)更好地理解語義相似性,就是說即便使用了完全不同的方式來表達,我們也希望它能理解人們希望表達的概念和想法是相同的。我們在提升語音合成質(zhì)量以及缺乏訓(xùn)練數(shù)據(jù)的文本轉(zhuǎn)語音任務(wù)中的研究成果,未來也可能為谷歌的產(chǎn)品增加新的功能。
量子計算是一種正在逐漸發(fā)展壯大的計算范式,它有能力解決經(jīng)典計算機無法解決的非常困難的問題。在過去的幾年中我們一直積極地在這個方向上進行科學(xué)研究,我們也相信,量子計算機展現(xiàn)出解決多種問題能力(所謂的量子霸權(quán))的那個時刻即將到來,而這也將成為這個領(lǐng)域的分水嶺。2018 年里,我們的量子計算實驗產(chǎn)生了一系列令人興奮的新成果,其中包括一個新的 72 位的量子計算設(shè)備 Bristlecone,它極大地拓展了量子計算機可以解決的問題的大小。我們距離量子霸權(quán)的距離越來越近了。
我們也發(fā)布了 Cirq,這是一個為量子計算機開發(fā)的開源編程框架,我們也借助它探索了如何在量子計算機上運行神經(jīng)網(wǎng)絡(luò)。最后,我們分享了研究量子處理器性能漲落的問題的及經(jīng)驗和技巧,也分享了關(guān)于「量子計算機有可能可以成為神經(jīng)網(wǎng)絡(luò)的計算性基礎(chǔ)設(shè)施」的想法。2019 年里,我們期待在量子計算空間里做出更多驚喜的成果。
對于自然語言處理領(lǐng)域,2018 年里谷歌收獲頗豐,我們有許多科研成果,也有許多關(guān)注于產(chǎn)品的內(nèi)部團隊合作成果(https://ai.googleblog.com/search/label/Natural%20Language%20Understanding)。我們在 2017 年發(fā)布的 Transformer 基礎(chǔ)上做了改進,得到了一個新的時間并行的模型版本,我們把它稱作 Universal Transformer,它在包括翻譯、語意推理等許多自然語言任務(wù)中都展現(xiàn)出了極大的性能提升。我們也開發(fā)了 BERT,這是首個深度雙向、無監(jiān)督的語言表示,它只需要在普通的文本語料上預(yù)訓(xùn)練,然后就可以通過遷移學(xué)習(xí)精細(xì)調(diào)節(jié)到許多種不同的自然語言任務(wù)上。相比之前的最佳表現(xiàn)的模型,BERT 在 11 種自然語言任務(wù)中都取得了顯著的表現(xiàn)提升。
除了和許多谷歌內(nèi)部的產(chǎn)品團隊合作開發(fā)了上文提到的 Smart Compose 和 Duplex 之外,我們也探索改進了谷歌助手,讓它能夠更好地處理多語言混用的場景。我們的最終目的是希望所有的用戶都可以與它自然地用語言交流。
我們在感知方面的研究攻克了讓計算機理解圖像、聲音、音樂和視頻等有難度的問題,同時也為圖像捕捉、壓縮、處理、創(chuàng)意表達以及增強現(xiàn)實提供了更多更有力的工具。2018 年,我們把新技術(shù)融合進了谷歌照片 app,它可以更好地整理用戶在意的照片內(nèi)容,比如人和寵物。谷歌 Lens 和谷歌助手則可以幫助用戶了解自然世界、實時回答問題,谷歌圖像中的 Lens 還有更多新功能。我們曾經(jīng)表示過,谷歌 AI 的使命中有一個重要的方面就是要給人類賦能、讓他們從技術(shù)中受益,這一年中我們也對谷歌 API 做了許多升級,改進了它的功能、更新了它的基礎(chǔ)組件。一些例子包括谷歌云機器學(xué)習(xí) API 中的視覺和視頻的升級的新功能,以及通過 ML Kit 實現(xiàn)的許多運行在移動設(shè)備上基礎(chǔ)組件,提供了面部識別相關(guān)一些功能。
2018 年中,我們對學(xué)術(shù)研究的貢獻包括了深度學(xué)習(xí)三維場景理解方面的進展,比如立體變換(stereo magnification,https://arxiv.org/abs/1805.09817),它可以為一個場景生成全新角度、而且具有逼真畫質(zhì)的圖像。我們也有一些持續(xù)進行中的研究,可以更好地理解圖像和視頻,也就可以幫助用戶更好地發(fā)現(xiàn)、組織、增強以及改進谷歌產(chǎn)品(谷歌圖像、YouTube、谷歌搜索等)中出現(xiàn)的圖像和視頻。這一年中值得一提的改進包括:用于快速聯(lián)合姿態(tài)估計以及人體實例分割的自底向上模型(https://arxiv.org/abs/1803.08225),一個用于復(fù)雜動作可視化的系統(tǒng)(http://mosculp.csail.mit.edu/),一個可以對人和物體之間的的時間-空間關(guān)系建模的系統(tǒng)(https://ai.google/research/pubs/pub47219),以及借助蒸餾(https://arxiv.org/abs/1812.08249)和 3D 卷積技術(shù)(https://ai.google/research/pubs/pub47220)改進視頻動作識別。
在語音領(lǐng)域,我們提出了一種方法用于語義音頻表示的無監(jiān)督學(xué)習(xí)(https://ieeexplore.ieee.org/abstract/document/8461684),也提出了「高表現(xiàn)力、仿人類語音生成」的重大技術(shù)改進(Tacotron,https://arxiv.org/abs/1803.09047)。同時,多模態(tài)感知也是一個越來越重要的研究話題?!竿ㄟ^看來聽」(https://arxiv.org/abs/1804.03619)綜合了輸入視頻中的視覺和音頻線索,然后可以抽取、增強視頻中指定說話者的聲音。這種技術(shù)有廣泛的應(yīng)用場景,從視頻增強和識別、到視頻通話、再到更好的聽力輔助設(shè)備都可以運用,尤其適合同時有多個人說話的場景。
在資源有限的平臺上實現(xiàn)感知也越來越重要。我們的第一代移動平臺計算機視覺模型 MobileNets 已經(jīng)在學(xué)術(shù)界和工業(yè)界得到了廣泛應(yīng)用,而我們也在 2018 年發(fā)布了第二代模型 MobileNetV2(https://arxiv.org/abs/1801.04381)。在 MorphNet (https://arxiv.org/abs/1711.06798)中,我們提出了一種高效的方法學(xué)習(xí)深度神經(jīng)網(wǎng)絡(luò)的架構(gòu),它在符合計算資源限制的情況下為圖像和音頻模型提供了全面的性能改進,而更新的自動網(wǎng)絡(luò)生成方面的研究則表明了可以針對硬件設(shè)計表現(xiàn)更加優(yōu)異的模型。
在過去的幾年中,手機攝像頭畫質(zhì)以及易用性的提升可以說是嘆為觀止。其中一部分改進自然來自于手機攝像頭使用的感光器越來越先進,但同時更大的功勞在于計算圖像學(xué)領(lǐng)域的科學(xué)技術(shù)改進。我們谷歌的研究團隊發(fā)表了自己的最新研究成果,也和谷歌的安卓系統(tǒng)團隊、消費級硬件團隊緊密協(xié)作,把這項成果搭載在最新的 Pixel 手機以及其它的設(shè)備上,并最終送達用戶手中。早在 2014 年,我們就發(fā)布了 HDR+ 技術(shù),它讓手機快速連拍多張曝光不同的照片,然后在軟件中對齊這幾張照片,并通過計算軟件把它們合并為一張照片。最初 HDR+ 的設(shè)計目的是讓照片具有比只拍一張照片更大的動態(tài)范圍,后來,快速連拍多張照片并基于它們做計算性分析已經(jīng)成了一種通用的模式,2018 年的手機攝像頭基于這種模式開發(fā)了更多的功能,比如 Pixel 2 手機中的運動照片,以及動作靜止照片中的增強現(xiàn)實模式。
今年,我們在計算圖像學(xué)研究上的主要努力是為手機攝像頭開發(fā)了一種新的能力,夜視,可以讓 Pixel 手機在夜里看得更清晰,這項功能也獲得了媒體和用戶的一致好評。當(dāng)然了,夜視僅僅是谷歌團隊開發(fā)的幫助用戶拍出完美照片的眾多功能之一,這些功能都基于軟件、服務(wù)于攝像頭,它們包括:用機器學(xué)習(xí)帶來更好的人像模式照片,通過超級清晰變焦看得更清楚、更遠(yuǎn),以及用 Top Shot 和谷歌 Clips 捕捉特殊瞬間。
算法是谷歌各個系統(tǒng)背后的支撐骨架,各種算法決定著從谷歌旅行的路程規(guī)劃系統(tǒng),到谷歌云的持續(xù)哈希系統(tǒng)等等的所有谷歌產(chǎn)品的表現(xiàn)。在過去的一年中,我們繼續(xù)在算法和理論方面進行著深入的科學(xué)研究(https://ai.google/research/pubs/?area=AlgorithmsandTheory&year=2018),從理論基礎(chǔ)到實用算法,以及從圖挖掘(https://ai.google/research/teams/algorithms-optimization/graph-mining/)到保持隱私的計算方法。我們在優(yōu)化算法方面的探索覆蓋了許多領(lǐng)域,從用于機器學(xué)習(xí)的連續(xù)優(yōu)化,到分布式的組合優(yōu)化。在前一個領(lǐng)域,我們研究訓(xùn)練神經(jīng)網(wǎng)絡(luò)時的隨機優(yōu)化算法的收斂性的論文獲得了 ICLR 2018 的最佳論文獎,這篇論文展示了熱門的基于梯度的優(yōu)化方法存在的問題(比如 ADAM 的一些變種),同時也為一些新的基于梯度的優(yōu)化方法提供了扎實的理論基礎(chǔ)。(https://ai.google/research/pubs/pub47409)
對于分布式優(yōu)化問題,我們研究了如何改進組合優(yōu)化問題中的輪數(shù)和溝通復(fù)雜度,比如通過輪數(shù)壓縮(https://ai.google/research/pubs/pub46793)和核心組的圖中的匹配(https://ai.google/research/pubs/pub46793),以及子模最大化(https://ai.google/research/pubs/pub46927)和 k 核分解(https://ai.google/research/pubs/pub47742)。對于更偏向應(yīng)用的方面,我們開發(fā)了新算法解決通過草圖大規(guī)模設(shè)定封面(https://ai.google/research/pubs/pub46927),以及解決具有萬億條邊的圖的平衡分區(qū)以及層次化分簇問題。我們研究在線投遞服務(wù)的論文(https://doi.org/10.1145/3178876.3186104)得到了 WWW 2018 的最佳論文提名。還有,我們的開源優(yōu)化平臺 OR-tools (https://developers.google.com/optimization/)也在 2018 Minizinc 限定編程比賽中贏得了 4 面金牌。
對于算法選擇理論,我們提出了一些新的模型(https://doi.org/10.1145/3159652.3159702),也對重建問題(https://doi.org/10.1137/1.9781611975031.38)和多項式分對數(shù)的學(xué)習(xí)問題(http://proceedings.mlr.press/v80/chierichetti18a.html)做了一些調(diào)研。我們也研究了神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到的函數(shù)的類型(https://doi.org/10.4230/LIPIcs.ITCS.2018.22),以及如何使用機器學(xué)習(xí)的思想改進經(jīng)典在線算法(http://papers.nips.cc/paper/8174-improving-online-algorithms-via-ml-predictions)。
對于谷歌來說,了解一些有強有力的隱私保證的算法是有著重要意義的。在這樣的背景下,我們開發(fā)了兩種新的方法,通過迭代(https://ai.google/research/pubs/pub47118)和隨機排序(https://ai.google/research/pubs/pub47557)進一步分析并增強差分隱私。我們也使用差分隱私技術(shù)設(shè)計可以感知動機的學(xué)習(xí)方法(https://ai.google/research/pubs/pub46913),它們在博弈中很魯棒。類似這樣的學(xué)習(xí)技巧都在高效的在線市場設(shè)計中得到了應(yīng)用。我們在市場相關(guān)的算法領(lǐng)域也有一些新的研究,比如幫助廣告商測試廣告投放的動機兼容性的技術(shù)(https://ai.google/research/pubs/pub46968),以及優(yōu)化 app 內(nèi)廣告的刷新方式的技術(shù)(https://ai.google/research/pubs/pub46847)。我們也在重復(fù)拍賣問題中把當(dāng)前最優(yōu)的動態(tài)機制又向前推進了一步,我們的動態(tài)拍賣對于缺少未來預(yù)期(https://ai.google/research/pubs/pub47744)、預(yù)測有噪聲(https://ai.google/research/pubs/pub47745)、異質(zhì)買家行為(https://ai.google/research/pubs/pub46969)等狀況都可以保持魯棒,我們的結(jié)果還可以拓展到動態(tài)雙拍賣的場景中(https://ai.google/research/pubs/pub47734)。最后,在在線優(yōu)化和在線學(xué)習(xí)魯棒性問題中,我們開發(fā)了新的在線分配算法處理帶有流量峰值的隨機輸入(https://dl.acm.org/citation.cfm?id=3105446),以及對損壞的數(shù)據(jù)魯棒的修補算法(https://ai.google/research/pubs/pub47732)。
我們對于軟件系統(tǒng)的研究很大部分都繼續(xù)與構(gòu)建機器學(xué)習(xí)模型有著種種聯(lián)系,尤其是與 TensorFlow 有許多聯(lián)系。比如,我們針對 TensorFlow 1.0 發(fā)布了動態(tài)控制流的設(shè)計和實現(xiàn)(https://dl.acm.org/citation.cfm?id=3190551)。我們在后來的研究中介紹了一個稱作 Mesh TensorFlow 的系統(tǒng),通過它可以很方便地定義具有并行模型的大規(guī)模分布式計算,這樣的系統(tǒng)可以包含多達幾十億個參數(shù)。另一個例子是,我們還發(fā)布了一個用于可拓展的深度神經(jīng)排序的 TensorFlow 庫。
我們也發(fā)布了 JAX(https://github.com/google/jax),這是一個帶有加速器的 NumPy 的變種,它可以支持 Python 函數(shù)的任意階自動微分。雖然 JAX 并不包含在 TensorFlow 中,它所使用的部分底層基礎(chǔ)軟件其實是和 TF 相同的(比如 XLA,https://www.tensorflow.org/xla/),而且 JAX 的一些想法和算法也對 TF 起到了不小幫助。我們在機器學(xué)習(xí)的安全和隱私方面也做了更多研究,我們開發(fā)的安全、保證隱私的開源框架也用在了更多的 AI 系統(tǒng)中,比如 CleverHans (https://github.com/tensorflow/cleverhans)和 TensorFlow Privacy(https://github.com/tensorflow/privacy)。
我們看重的另一個研究方向是機器學(xué)習(xí)在軟件系統(tǒng)中的應(yīng)用,這可以發(fā)生在許多不同的層次上。比如,我們持續(xù)地研究用層次化模型向不同的設(shè)備分配計算任務(wù)(https://openreview.net/pdf?id=Hkc-TeZ0W),以及我們參與了學(xué)習(xí)內(nèi)存訪問模式的研究(http://proceedings.mlr.press/v80/hashemi18a/hashemi18a.pdf)。我們也繼續(xù)探索如何用模型學(xué)習(xí)到的索引在數(shù)據(jù)庫和存儲系統(tǒng)中替代傳統(tǒng)的索引結(jié)構(gòu)。正如我在去年的總結(jié)中寫的,對于如何在計算機系統(tǒng)中使用機器學(xué)習(xí),我們目前的認(rèn)識其實還處在非常早期。
2018 年里我們也結(jié)識了 Spectre 和 Meltdown 這兩個現(xiàn)代計算機處理器帶有的嚴(yán)重安全漏洞,它們也正是在谷歌的零計劃(Project Zero)團隊與其他團隊的合作中發(fā)現(xiàn)的。這些漏洞以及其它相關(guān)的漏洞著實讓計算機架構(gòu)研究人員們忙活了一陣子。在我們持續(xù)地對 CPU 的行為建模的過程中,我們的編譯器研究團隊把他們的測量機器指令延遲和端口壓力的工具集成進了 LLVM 中,這讓編譯器得以做出更好的決定。
谷歌具有為計算、存儲和網(wǎng)絡(luò)構(gòu)建大規(guī)模、可信賴、高效的技術(shù)架構(gòu)的能力,谷歌的消費者產(chǎn)品、谷歌的云端服務(wù)以及機器學(xué)習(xí)模型的推理就都高度依賴于這種能力。在過去的一年中,這些方面的研究亮點包括谷歌最新進化的軟件防御網(wǎng)絡(luò) WAN(https://ai.google/research/pubs/pub47191);一個獨立工作、聯(lián)邦式的查詢處理平臺,它可以在以不同的文件形式存儲的數(shù)據(jù)上、在許多不同的存儲系統(tǒng)上執(zhí)行 SQL 查詢語句(https://ai.google/research/pubs/pub47224);以及一個關(guān)于我們谷歌的代碼審查做法的詳細(xì)報告,包含了谷歌的代碼審查背后的動機、目前的慣例、開發(fā)者的滿意狀況以及挑戰(zhàn)(https://ai.google/research/pubs/pub47025)。
運行一個內(nèi)容存儲之類的大規(guī)模網(wǎng)絡(luò)服務(wù)需要在不斷變化的環(huán)境中做穩(wěn)定的負(fù)載均衡。我們開發(fā)了一個持續(xù)的哈希方案(https://dl.acm.org/citation.cfm?id=3175309),它對于每一個服務(wù)器的最大負(fù)載有一個嚴(yán)密、可證明的保證,我們把它部署在了谷歌云的 Pub/Sub (https://cloud.google.com/pubsub/)上,為谷歌云的客戶提供服務(wù)。在發(fā)布了最初版本的論文(https://arxiv.org/abs/1608.01350)之后,Vimeo 的工程師注意到了這篇論文,實現(xiàn)了它并把它開源到 haproxy,然后在 Vimeo 的負(fù)載均衡項目中使用它。它帶來了顯著的改進,這些算法思想的運用大幅降低了服務(wù)器緩存的帶寬需求,幾乎只有原先的 1/8,消除了一個重大性能瓶頸。
(未完,下半篇見這里)
via https://ai.googleblog.com/2019/01/looking-back-at-googles-research.html,雷鋒網(wǎng) AI 科技評論編譯
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。