0
本文作者: 楊曉凡 | 2018-06-08 09:49 |
雷鋒網(wǎng) AI 科技評(píng)論按:近日,ISCA 2018,同時(shí)也是第 45 屆 ISCA,于當(dāng)?shù)貢r(shí)間 6 月 2 日至 6 日在美國(guó)加州洛杉磯市召開(kāi)。
ISCA(International Symposium on Computer Architecture)是計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議,由 ACM SIGARCH(計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)特殊興趣組) 和 IEEE TCCA(計(jì)算機(jī)架構(gòu)技術(shù)委員會(huì))聯(lián)合舉辦。在計(jì)算機(jī)領(lǐng)域的各種應(yīng)用和人才遍地開(kāi)花、大數(shù)據(jù)與深度學(xué)習(xí)引發(fā)新的發(fā)展浪潮的當(dāng)代,ISCA 的會(huì)議規(guī)模也有所擴(kuò)大 —— 接近歷史紀(jì)錄的超過(guò) 785 名參會(huì)者,以及比去年增加了 17%、達(dá)到了共 378 篇的論文投稿;最終接收論文數(shù)目為 64 篇,接收率為 17%。據(jù)了解,從 1973 年創(chuàng)辦到 2008 年在北京召開(kāi)的這 35 屆 ISCA 大會(huì)中,中國(guó)大陸科研機(jī)構(gòu)一共只發(fā)表過(guò) 5 篇文章。這些數(shù)字都體現(xiàn)了計(jì)算機(jī)架構(gòu)領(lǐng)域的深度、ISCA 會(huì)議的難度與聲譽(yù)。(相比之下機(jī)器學(xué)習(xí)領(lǐng)域相關(guān)會(huì)議近年來(lái)出現(xiàn)的海量投稿數(shù)可以看做體現(xiàn)了大家都認(rèn)為「這有什么難,我也可以發(fā)論文」)
除了例行的大會(huì)報(bào)告、圓桌討論、論文 session、workshop、tutorial、洛杉磯市內(nèi)觀光大巴游覽之外,會(huì)議還有一大亮點(diǎn)是邀請(qǐng)了今年 3 月剛剛頒布的圖靈獎(jiǎng)獲得者 John L. Hennessy 和 David A. Patterson 到場(chǎng)演講。實(shí)際上,二人獲得有「計(jì)算機(jī)領(lǐng)域的諾貝爾獎(jiǎng)」之稱的圖靈獎(jiǎng),正是因?yàn)槎恕?strong>開(kāi)創(chuàng)了一種系統(tǒng)的、定量的方法來(lái)設(shè)計(jì)和評(píng)價(jià)計(jì)算機(jī)體系結(jié)構(gòu),并對(duì) RISC 微處理器行業(yè)產(chǎn)生了持久的影響」(ACM 頒獎(jiǎng)詞),這正是 ISCA 會(huì)議關(guān)注的核心課題之一。獲獎(jiǎng)后在 ISCA 進(jìn)行主題演講,二人想必也收到了最熱烈的掌聲和最高的敬意。
第一天早上的開(kāi)幕演講中組委會(huì)首先介紹了會(huì)議概況。如前文所說(shuō),今年 ISCA 共有超過(guò) 785 名參會(huì)者,大約 710 名參與了會(huì)議正會(huì)。這一數(shù)字有可能會(huì)創(chuàng)下 ISCA 這 45 年來(lái)的新的歷史紀(jì)錄。會(huì)議設(shè)置了 18 個(gè)論文報(bào)告 session,主題包括云和數(shù)據(jù)中心、新興 app 的加速、預(yù)讀?。╬refetching)、語(yǔ)言和模型、虛擬內(nèi)存、相關(guān)性與存儲(chǔ)排序、新興范式、持續(xù)性(persistence)、新興內(nèi)存、存儲(chǔ)器、控制器和控制系統(tǒng)、移動(dòng)平臺(tái)、安全、互聯(lián)網(wǎng)絡(luò)、GPU,以及近年來(lái)火熱的機(jī)器學(xué)習(xí)系統(tǒng)。
除了 John Hennessy 與 David Patterson 的圖靈獎(jiǎng)獲獎(jiǎng)演講外,還有三位特邀嘉賓 Kim Hazelwood、Kunle Olukotun、Doug Burger 的主題演講以及 ACM - IEEE CS Eckert-Mauchly 獎(jiǎng)獲得者 Susan Eggers 的演講。
ISCA 2018 的論文投稿為 378 篇,比去年增加了 17%;接收論文數(shù)目為 64 篇,接收率為 17%。接收結(jié)果出自程序委員會(huì)對(duì)論文進(jìn)行的兩個(gè)階段的詳細(xì)評(píng)審。投稿論文中數(shù)量最多的研究課題為加速及領(lǐng)域?qū)S眉軜?gòu),前十熱門(mén)的課題還有內(nèi)存系統(tǒng)、多核和并行架構(gòu)、微架構(gòu)、低功耗架構(gòu)與技術(shù)、新興內(nèi)存技術(shù)、層級(jí)化緩存、新興計(jì)算架構(gòu)、云與數(shù)據(jù)中心規(guī)模的計(jì)算、計(jì)算機(jī)系統(tǒng)的評(píng)價(jià)。
組委會(huì)也設(shè)法統(tǒng)計(jì)了會(huì)議中的性別平衡情況:在提交論文時(shí)作者們可以自愿提供性別信息,參與了信息提交的論文約占 37%;這部分論文的統(tǒng)計(jì)結(jié)果是,約 15% 的論文投稿中至少有 1 位女性作者,同時(shí) 15% 的接收論文的第一作者為女性!組委會(huì)也期待這個(gè)領(lǐng)域的性別比例未來(lái)可以繼續(xù)改善。
首位演講的特邀嘉賓是來(lái)自 Facebook 的 Kim Hazelwood。Kim 是 Facebook 人工智能基礎(chǔ)設(shè)施團(tuán)隊(duì)(Facebook AI Infrastructure Foundation)的負(fù)責(zé)人,這個(gè)團(tuán)隊(duì)的職責(zé)是為 Facebook 的的生產(chǎn)化和移動(dòng)化機(jī)器學(xué)習(xí)應(yīng)用設(shè)計(jì)高效的、可拓展的軟硬件平臺(tái),而她自己的研究興趣包括負(fù)載描述、性能分析、計(jì)算機(jī)系統(tǒng)架構(gòu)以及可拓展的數(shù)據(jù)中心系統(tǒng)。
Kim Hazelwood 的演講主題為「Applied Machine Learning at Facebook Scale: Separating Opportunity from Hype」(Facebook 規(guī)模的機(jī)器學(xué)習(xí)應(yīng)用:從熱潮中看到機(jī)會(huì)),介紹了在熱炒的機(jī)器學(xué)習(xí)概念背后,F(xiàn)acebook 為了真正地應(yīng)用機(jī)器學(xué)習(xí)技術(shù)做出的努力和相關(guān)的發(fā)現(xiàn);這里也是機(jī)器學(xué)習(xí)和計(jì)算機(jī)架構(gòu)設(shè)計(jì)的交叉點(diǎn)。演講中有一些對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的研究人員以及應(yīng)用開(kāi)發(fā)人員很有啟發(fā)的信息:
用一定的數(shù)據(jù)訓(xùn)練一個(gè)模型需要多少計(jì)算量、多少時(shí)間大家基本都心里有數(shù),那么推理階段的計(jì)算量需求如何呢?實(shí)際上 Facebook 的機(jī)器學(xué)習(xí)模型每天要做超過(guò)兩千億次推理,其中包括五十億次語(yǔ)言翻譯,以及數(shù)百萬(wàn)次的由自動(dòng)檢測(cè)系統(tǒng)主動(dòng)地刪除假冒賬戶。
在研究機(jī)器學(xué)習(xí)理論本身的人看來(lái),工作流程分為「數(shù)據(jù)-特征-訓(xùn)練-評(píng)價(jià)-推理」五部分是自然而然的事情。而根據(jù)機(jī)器學(xué)習(xí)算法應(yīng)用時(shí)的系統(tǒng)需求來(lái)看,計(jì)算機(jī)架構(gòu)研究人員眼中的機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)的存儲(chǔ)、網(wǎng)絡(luò)連接、計(jì)算能力都提出了新的挑戰(zhàn)。
大規(guī)模應(yīng)用機(jī)器學(xué)習(xí)系統(tǒng)時(shí)的系統(tǒng)瓶頸在哪里?我們現(xiàn)在對(duì)計(jì)算和存儲(chǔ)都有許多的并行化手段,所以根據(jù)阿姆達(dá)爾定律,最大的瓶頸已經(jīng)變成了(難以并行化的)網(wǎng)絡(luò)連接。
從工程角度看,什么樣的研究投入方式是有效的?不是什么熱就投入什么,投入程度應(yīng)當(dāng)和機(jī)會(huì)(也就是系統(tǒng)瓶頸)相對(duì)應(yīng)。假如網(wǎng)絡(luò)因素對(duì)系統(tǒng)瓶頸的貢獻(xiàn)為 75%,那么就不應(yīng)當(dāng)在已經(jīng)熱門(mén)的計(jì)算領(lǐng)域投入 75%,而就應(yīng)該在網(wǎng)絡(luò)因素方面投入 75%。
所以 Kim 也提出了自己的「機(jī)會(huì)方程」:正確的投入方式需要有一些不平衡;要小心別人一窩蜂擠進(jìn)去的領(lǐng)域。已經(jīng)擁入很多研究者的領(lǐng)域包括量化、做硬件的推理加速器初創(chuàng)公司、不必要的深度學(xué)習(xí)方法。而計(jì)算、網(wǎng)絡(luò)與存儲(chǔ)之間的平衡,工具、編譯器、軟件,端到端解決方案等課題就是不那么火熱的、更適合的投入方向。
目前全世界已經(jīng)有超過(guò) 10 億部手機(jī)上運(yùn)行著神經(jīng)網(wǎng)絡(luò)應(yīng)用。在移動(dòng)設(shè)備上本地運(yùn)行的機(jī)器學(xué)習(xí)算法在隱私性、本地響應(yīng)性和用戶體驗(yàn)上都有更好的表現(xiàn),但移動(dòng)設(shè)備的一大挑戰(zhàn)就是計(jì)算能力非常有限,使用 ARM 處理器的設(shè)備中 60% 還是基于老舊的 32 位 arm-v7 指令集,同時(shí)超過(guò)半數(shù)的設(shè)備只有不多于 4 個(gè)核心。這樣的結(jié)果就是,峰值計(jì)算性能高于 200 GFlops 的設(shè)備只有不到 20%,高于 600 GFlops 的簡(jiǎn)直鳳毛麟角。
網(wǎng)絡(luò)連接狀況也不容樂(lè)觀,4G 網(wǎng)絡(luò)的覆蓋區(qū)域非常有限,更別提還有很多連 2G 都沒(méi)有的區(qū)域了。(雷鋒網(wǎng) AI 科技評(píng)論注:中國(guó)區(qū)域是黑色應(yīng)該只是因?yàn)?Facebook 沒(méi)有詳細(xì)的數(shù)據(jù)。實(shí)際上根據(jù)中國(guó)信息通信研究院發(fā)布的數(shù)據(jù),截至 2017 年 6 月,我國(guó) 4G 基站已累計(jì)建成約 300 萬(wàn)個(gè),而全世界的 4G 基站總數(shù)也就只有約 500 萬(wàn)個(gè))
而如果想要開(kāi)發(fā)在移動(dòng)設(shè)備上運(yùn)行的機(jī)器學(xué)習(xí)模型,嚴(yán)重的生態(tài)碎片化也帶來(lái)了許多麻煩:超過(guò) 20 家芯片制造商、超過(guò) 25 種處理器微架構(gòu)、超過(guò) 15 種 GPU 架構(gòu)、兩種主流操作系統(tǒng)、三種主流圖形 API、兩種主流計(jì)算 API。
除了移動(dòng)計(jì)算的挑戰(zhàn)之外,大規(guī)??赏卣箼C(jī)器學(xué)習(xí)應(yīng)用也需要面對(duì)晝夜負(fù)載不平衡、硬件設(shè)施采購(gòu)慣性、容災(zāi)與恢復(fù)、軟件平臺(tái)設(shè)計(jì)等挑戰(zhàn)。在演講最后,Kim 希望大家不要忘記了各項(xiàng)技術(shù)發(fā)展的基本規(guī)律,并以此著眼解決那些真正重大的問(wèn)題。
Alphabet 公司董事長(zhǎng)、斯坦福大學(xué)前校長(zhǎng) John Hennessy 與谷歌 TPU 團(tuán)隊(duì)、UC 伯克利大學(xué)退休教授David Patterson 的圖靈獎(jiǎng)獲獎(jiǎng)演講自然也是會(huì)議的重頭戲之一。他們的演講題目是「A New Golden Age for Computer Architecture: Domain-Specific Hardware/Software Co-Design, Enhanced Security, Open Instruction Sets, and Agile Chip Development」(計(jì)算機(jī)架構(gòu)的新的黃金時(shí)代:領(lǐng)域?qū)S玫能浻布f(xié)同設(shè)計(jì),增強(qiáng)的安全性,開(kāi)放指令集,以及敏捷芯片開(kāi)發(fā))。
演講內(nèi)容要點(diǎn)如下:
自 1980 年代 Carver Mead 和 Lynn Conway 讓芯片設(shè)計(jì)變得平民化,以及高級(jí)編程語(yǔ)言取代了機(jī)器語(yǔ)言之后,RISC、超標(biāo)量、多級(jí)緩存、預(yù)測(cè)與編譯等方面的計(jì)算機(jī)架構(gòu)創(chuàng)新開(kāi)啟了電子計(jì)算機(jī)發(fā)展的一個(gè)黃金時(shí)代,計(jì)算機(jī)的性能幾乎每年都可以增長(zhǎng) 60%。稍后到了 1990 和 2000 年代,計(jì)算架構(gòu)方面的創(chuàng)新雖然開(kāi)始放緩,但不斷增加的處理器頻率和不斷增大的處理器緩存依然引領(lǐng)了計(jì)算性能的持續(xù)提高。直到近年來(lái) Dennard 縮放定律和摩爾定律也開(kāi)始失效,2017 年時(shí)單核心處理的性能僅僅比上一年提升了 3%。除了處理器性能提升遇到困難之外,Spectre 之類(lèi)的漏洞也展示出了基于運(yùn)行時(shí)間的攻擊導(dǎo)致信息泄露的風(fēng)險(xiǎn)。
上一個(gè)黃金時(shí)代已經(jīng)結(jié)束,但 John Hennessy 與 David Patterson 認(rèn)為一個(gè)新的黃金時(shí)代即將開(kāi)始。這個(gè)黃金時(shí)代的主題是大幅改善的成本、性能、能源消耗以及安全性。面對(duì)著已經(jīng)失效的 Dennard 縮放定律和摩爾定律無(wú)法繼續(xù)提供指數(shù)增加的資源,這些計(jì)算架構(gòu)方面的挑戰(zhàn)要比以前的挑戰(zhàn)更難解決。二人認(rèn)為,以下的幾個(gè)領(lǐng)域?qū)@個(gè)新的時(shí)代至關(guān)重要:
為高級(jí)別、領(lǐng)域?qū)S谜Z(yǔ)言服務(wù)的軟硬件協(xié)同設(shè)計(jì)
Python 之類(lèi)的高級(jí)編程語(yǔ)言以及 TensorFlow 之類(lèi)的領(lǐng)域?qū)S镁幊陶Z(yǔ)言通過(guò)提升軟件復(fù)用和抽象級(jí)別,大幅提升了程序開(kāi)發(fā)人員的生產(chǎn)力。曾經(jīng) 1980 年代時(shí) C 編譯器和 RISC 架構(gòu)的編譯器-微架構(gòu)協(xié)同設(shè)計(jì)帶來(lái)了三倍的性能提升,新的黃金時(shí)代里的新的技術(shù)進(jìn)展將有可能帶來(lái)新的編譯器和新的領(lǐng)域?qū)S糜?jì)算架構(gòu),十倍甚至更多的性能提升都不是夢(mèng)想。
增強(qiáng)的安全性
過(guò)去的 40 年里信息技術(shù)的發(fā)展日新月異,但信息安全的戰(zhàn)役中我們正節(jié)節(jié)敗退。直到現(xiàn)在,人們對(duì)于計(jì)算架構(gòu)安全性的要求也僅限于分頁(yè)級(jí)別的保護(hù)以及支持虛擬機(jī)的運(yùn)行。正是計(jì)算機(jī)架構(gòu)定義本身對(duì)于運(yùn)行時(shí)間的忽略導(dǎo)致了 Specture 這樣的攻擊方法出現(xiàn),根據(jù)運(yùn)算時(shí)間的長(zhǎng)短就可以泄露本來(lái)應(yīng)當(dāng)被保護(hù)的數(shù)據(jù)。架構(gòu)設(shè)計(jì)師們是時(shí)候重新定義計(jì)算機(jī)架構(gòu)了,安全應(yīng)當(dāng)成為第一要?jiǎng)?wù),保護(hù)數(shù)據(jù)不在運(yùn)行時(shí)間攻擊中泄露,或者起碼也要大幅減小這種風(fēng)險(xiǎn)。
免費(fèi)、開(kāi)放的計(jì)算架構(gòu)以及開(kāi)源的實(shí)現(xiàn)
為了改善上面提到的問(wèn)題,指令集架構(gòu)(ISA)很有可能需要作出改變,而這對(duì)于專(zhuān)有 ISA 來(lái)說(shuō)很難做到。為了有能力應(yīng)對(duì)這些艱巨的挑戰(zhàn),John Hennessy 與 David Patterson 希望有更多聰慧的大腦可以參與進(jìn)來(lái),而不僅僅是為現(xiàn)有的 ISA 持有者打工的工程師們。那么,RISC-V 這樣的免費(fèi)、開(kāi)放的 ISA 就可以成為一份送給研究人員們的大禮,因?yàn)椋?/p>
許多不同組織的人都可以同時(shí)為 RISC-V 做出貢獻(xiàn)
它的設(shè)計(jì)中注重模塊化和拓展性
它帶有完善的軟件堆棧,包括編譯器、操作系統(tǒng)和 debugger,它們都是開(kāi)源的,從而也就是可以定制化修改的
作為現(xiàn)代 ISA,它可以勝任云級(jí)別的服務(wù)器到移動(dòng)和 IoT 設(shè)備的各種應(yīng)用
RISC-V 由一個(gè)有 100 位成員的基金會(huì)推動(dòng),這保證了它的長(zhǎng)期穩(wěn)定性以及長(zhǎng)期演進(jìn)
以前不一樣的是,開(kāi)放的 ISA 如今是可行的,因?yàn)樵S許多多的工程師現(xiàn)在就正在通過(guò)知識(shí)產(chǎn)權(quán)集成的方式為各種不同的產(chǎn)品設(shè)計(jì)片上系統(tǒng)(SoC),同時(shí) ARM 也已經(jīng)表明了知識(shí)產(chǎn)權(quán)授權(quán)對(duì)于 ISA 是可行的。
另一方面,開(kāi)放的計(jì)算架構(gòu)也為 FPGA 和真實(shí)芯片兩者都帶來(lái)了開(kāi)源處理器設(shè)計(jì)的可能性,未來(lái)的架構(gòu)設(shè)計(jì)師只需修改現(xiàn)有的 RISC-V 設(shè)計(jì)以及對(duì)應(yīng)的軟件堆棧即可。即便 FPGA 實(shí)現(xiàn)的處理器的運(yùn)行速度可能只有 100MHz,這也已經(jīng)足夠運(yùn)行千百億條指令、或者部署在網(wǎng)絡(luò)上面對(duì)真實(shí)攻擊測(cè)試防御能力。借助 FPGA 的可塑性,RISC-V 生態(tài)系統(tǒng)可以讓新功能實(shí)驗(yàn)性探索的部署、評(píng)估、迭代升級(jí)流程從以往的若干年縮短到若干天。實(shí)現(xiàn)這種暢想所需的知識(shí)產(chǎn)權(quán)也將不僅限于 CPU,GPU、神經(jīng)網(wǎng)絡(luò)加速器、內(nèi)存控制器、PCIe 控制器等都需要。隨著摩爾定律的終結(jié),工藝過(guò)程穩(wěn)定性的提升也使得這個(gè)目標(biāo)比以前更容易達(dá)成。這種需求也會(huì)讓硬件架構(gòu)設(shè)計(jì)師們未來(lái)能夠產(chǎn)生大規(guī)模的影響,就像軟件工程師們可以參與數(shù)據(jù)庫(kù)系統(tǒng)、操作系統(tǒng)之類(lèi)的開(kāi)源項(xiàng)目開(kāi)發(fā)一樣。
芯片的敏捷開(kāi)發(fā)
隨著計(jì)算架構(gòu)創(chuàng)新的重點(diǎn)從通用計(jì)算 CPU 轉(zhuǎn)向領(lǐng)域?qū)S靡约爱愘|(zhì)計(jì)算處理器,芯片的設(shè)計(jì)時(shí)間及成本方面也需要有大的突破(就像 1980 年代 VLSI 帶來(lái)突破那樣)。小規(guī)模的團(tuán)隊(duì)也應(yīng)當(dāng)可以有能力為某個(gè)特別的領(lǐng)域或者應(yīng)用設(shè)計(jì)專(zhuān)用的芯片。這需要硬件設(shè)計(jì)流程變得更高效,更像現(xiàn)代軟件設(shè)計(jì)。
與大芯片公司采用的從頂向下/單向的 waterfall 開(kāi)發(fā)流程不同,敏捷開(kāi)發(fā)流程讓小團(tuán)隊(duì)也可以設(shè)計(jì)并迭代升級(jí)能夠工作、但并不完整的芯片原型設(shè)計(jì)。巧合的是,提升了軟件復(fù)用性的程序語(yǔ)言改進(jìn)如今也已經(jīng)集成在了最新的硬件設(shè)計(jì)語(yǔ)言中,這讓硬件設(shè)計(jì)和復(fù)用變得更為簡(jiǎn)單。論文中紙面上的芯片布局當(dāng)然不壞,但構(gòu)建出真實(shí)的芯片才是讓團(tuán)隊(duì)中每個(gè)成員都能感到激動(dòng)的事情,而且這也是驗(yàn)證運(yùn)行時(shí)間、能耗等重要特性的唯一方法。有一則好消息是,臺(tái)積電用最新工藝制作 100 個(gè)小型測(cè)試芯片的價(jià)格已經(jīng)下降到了只需 3 萬(wàn)美元,那么,可以說(shuō)是幾乎所有項(xiàng)目團(tuán)隊(duì)都可以負(fù)擔(dān)得起在真實(shí)芯片上做最終的驗(yàn)證步驟,同時(shí)也可以享受到自己的想法成功工作在硅片上的幸福感。
John Hennessy 與 David Patterson 兩人相信,標(biāo)準(zhǔn)的微處理越來(lái)越難以提升的性能、高級(jí)別領(lǐng)域?qū)S玫恼Z(yǔ)言與安全性方面的機(jī)會(huì)、專(zhuān)有 ISA 鏈上的架構(gòu)設(shè)計(jì)師的解放、以及 Dennard 縮放定律和摩爾定律的失效將共同帶來(lái)一個(gè)計(jì)算架構(gòu)的新的黃金時(shí)代。開(kāi)源生態(tài)系統(tǒng)、芯片原型的敏捷開(kāi)發(fā)都會(huì)帶來(lái)實(shí)實(shí)在在的進(jìn)步,從而加速商業(yè)應(yīng)用。兩人期待新的黃金時(shí)代的技術(shù)進(jìn)步會(huì)像上一個(gè)時(shí)代一樣地快,只不過(guò)如今的關(guān)注點(diǎn)是在于成本、能耗、安全,同時(shí)兼顧性能。
在 ISCA 2018 的頒獎(jiǎng)環(huán)節(jié),除了多位新入選 IEEE Fellow、ACM Fellow 的頒獎(jiǎng),以及多個(gè) ACM SIGARCH、IEEE TCCA 獎(jiǎng)項(xiàng)外,還有一個(gè)重頭戲,那就是 Eckert-Mauchly 獎(jiǎng)的頒獎(jiǎng)。
ACM - IEEE CS Eckert-Mauchly 獎(jiǎng)是計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域最負(fù)盛名的獎(jiǎng)項(xiàng),獲獎(jiǎng)?wù)哂?ACM 和 IEEE 共同評(píng)選,獎(jiǎng)項(xiàng)命名來(lái)源于 1947 年誕生的首臺(tái)電子計(jì)算機(jī) ENIAC 的設(shè)計(jì)者和制造者 John Presper Eckert 與 John William Mauchly(可見(jiàn)獎(jiǎng)項(xiàng)的重大意義),旨在獎(jiǎng)勵(lì)在計(jì)算機(jī)及數(shù)字化系統(tǒng)架構(gòu)方面做出杰出貢獻(xiàn)的研究者。
2018 年 ACM - IEEE CS Eckert-Mauchly 獎(jiǎng)的獲得者是華盛頓大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院教授 Susan Eggers,以表彰她在同步多線程處理器架構(gòu)和多處理器緩存共享與一致性方面的杰出貢獻(xiàn)。Susan Eggers 是領(lǐng)域內(nèi)頂尖的計(jì)算機(jī)架構(gòu)設(shè)計(jì)師,是 Eckert-Mauchly 獎(jiǎng)設(shè)立 39 年來(lái)的第一位女性獲得者,還是一位經(jīng)歷非常獨(dú)特的工程師。Susan Eggers 于 1965 年獲得了經(jīng)濟(jì)學(xué)碩士學(xué)位,在相關(guān)領(lǐng)域工作了 18 年后,決定改變職業(yè),轉(zhuǎn)向了計(jì)算機(jī)工程方面的研究。1983 年,Susan Eggers 進(jìn)入 UC 伯克利大學(xué)電子工程和計(jì)算機(jī)科學(xué)系讀研究生,于 1989 年獲得博士學(xué)位,然后來(lái)到華盛頓大學(xué)以助理教授的身份開(kāi)始她的學(xué)術(shù)生涯;此時(shí)的她已經(jīng) 47 歲。
從 1980 年代末起,Susan Eggers 在共享緩存的一致性(coherency)協(xié)議以及其他內(nèi)存相關(guān)的多處理器問(wèn)題中做出了重大成果;她展開(kāi)了最早的數(shù)據(jù)驅(qū)動(dòng)方法的關(guān)于共享內(nèi)存的多處理器計(jì)算機(jī)的實(shí)驗(yàn),這極大地提升了整個(gè)領(lǐng)域?qū)τ谲浖陀布恢滦约夹g(shù)的理解。她也因此在 2002 年當(dāng)選 ACM Fellow。
Susan Eggers 最著名的成果是在同步多線程(simultaneous multithreaded,SMT)處理器的開(kāi)發(fā)以及商業(yè)化方面的開(kāi)創(chuàng)性工作;這是過(guò)去三十年的計(jì)算機(jī)架構(gòu)發(fā)展歷程中最重要的進(jìn)步之一。面對(duì)簡(jiǎn)單增加邏輯和存儲(chǔ)單元無(wú)法繼續(xù)顯著提升處理器性能的狀況,Susan Eggers 等研究者提出,讓計(jì)算機(jī)有能力同時(shí)計(jì)算多項(xiàng)操作、執(zhí)行多個(gè)進(jìn)程,也就是提升計(jì)算機(jī)的并行計(jì)算能力,是最好的提升性能方式。在 1995 到 2003 年間,Susan Eggers 和她的同事們開(kāi)發(fā)并驗(yàn)證了同步多線程技術(shù),作為提升 CPU 性能的新方式。同步多線程技術(shù)允許多個(gè)獨(dú)立的程序指令序列(也就是線程)把它們的線程并行方式轉(zhuǎn)化為更簡(jiǎn)單的指令級(jí)別的并行方式,從而更好地利用了計(jì)算機(jī)中的資源,達(dá)到了性能提升。Susan Eggers 和她的同事們?cè)?ISCA 發(fā)表了多篇標(biāo)志性的論文并介紹了許多領(lǐng)先發(fā)現(xiàn),展現(xiàn)了同步多線程技術(shù)背后的思想、顯著的性能提升以及實(shí)現(xiàn)這項(xiàng)技術(shù)的簡(jiǎn)易性。
雷鋒網(wǎng) AI 科技評(píng)論對(duì) ISCA 2018 的介紹就到這里。更多人工智能、計(jì)算機(jī)、機(jī)器學(xué)習(xí)學(xué)術(shù)動(dòng)向,請(qǐng)繼續(xù)關(guān)注我們。
ISCA 2018 官網(wǎng):iscaconf.org
圖靈獎(jiǎng)演講視頻回放:https://www.acm.org/hennessy-patterson-turing-lecture
現(xiàn)場(chǎng)照片來(lái)源 IEEE Soft-magazine 及 清華大學(xué)博士生涂鋒斌,特此感謝。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。