0
本文作者: 我在思考中 | 2021-10-27 14:31 |
人工智能從5、6年前的 “黑科技”變成了今天的“熱科技”,背后離不開算力支撐能力的巨大飛躍。2020年以GPU為代表的AI加速芯片所交付的計算力總和已經(jīng)超過了通用CPU,預計到2025年,加速芯片所提供的計算力可能超過80%。可以說,人工智能的規(guī)模化發(fā)展,算力已經(jīng)成為決定性的力量,智慧計算是智慧時代的核心生產(chǎn)力。
“人工智能帶來指數(shù)級增長的算力需求,計算產(chǎn)業(yè)正面臨著多元化、巨量化、生態(tài)離散化交織的趨勢與挑戰(zhàn)。一方面多樣化的智能場景需要多元化的算力,巨量化的模型、數(shù)據(jù)和應用規(guī)模需要巨量的算力,算力已經(jīng)成為人工智能繼續(xù)發(fā)展的重中之重;另一方面從芯片到算力的轉(zhuǎn)化依然存在巨大鴻溝,多元算力價值并未得到充分釋放。如何快速完成多元芯片到計算系統(tǒng)的創(chuàng)新,已經(jīng)成為推動人工智能產(chǎn)業(yè)發(fā)展的關鍵環(huán)節(jié)?!痹?0月16日舉行的2021人工智能計算大會(AICC2021)上,中國工程院院士、浪潮首席科學家王恩東闡釋了計算系統(tǒng)創(chuàng)新在計算到智算轉(zhuǎn)變的產(chǎn)業(yè)新格局下的重大意義。
多元芯片到算力轉(zhuǎn)化,計算系統(tǒng)創(chuàng)新是關鍵
隨著人工智能在算法領域的不斷突破,不同數(shù)值精度帶來了跨度更大的計算類型,對計算芯片指令集、架構(gòu)的要求更加細分。圖靈獎獲得者 John Hennessy和 David Patterson共同發(fā)表的《計算機架構(gòu)的新黃金時代》中提出:當摩爾定律不再適用,一種更加以硬件為中心的DSA(Domain Specific Architecture)架構(gòu)設計會成為主導,這種設計的核心在于針對特定問題或特定領域來定義計算架構(gòu)。基于DSA思想設計的AI芯片,在特定AI工作負載上表現(xiàn)出遠超通用芯片的處理能力,大大推動了AI芯片的多元化發(fā)展。
芯片的多元化為產(chǎn)業(yè)AI化的加速提供了重要的產(chǎn)業(yè)基礎和更加豐富的選擇。但是,芯片從造出來到大規(guī)模用起來,還隔著一個巨大的產(chǎn)業(yè)鴻溝。一方面,算力的供給需要構(gòu)建算力平臺,需要解決架構(gòu)設計、核心部件、高速互聯(lián)、散熱設計等一系列問題。以一臺AI服務器研制為例,整個系統(tǒng)需要經(jīng)過30 多個開發(fā)流程,使用150 多種加工制造工藝,對280多個關鍵過程控制點的質(zhì)量進行嚴格把控,并且還要實現(xiàn)與算法框架和AI應用的優(yōu)化和適配等問題;另一方面,面對大規(guī)模AI算力部署,AI算力平臺建設又面臨高功耗、高電流密度、高總線速率、高系統(tǒng)復雜度的新問題。
“我們能造出性能強大的火箭發(fā)動機,但要想造出安全、高性能的運載火箭,還要在循環(huán)、控制、結(jié)構(gòu)等很多領域做大量的工作。芯片到計算系統(tǒng)同樣如此,需要完成體系結(jié)構(gòu)、信號完整性、散熱、可靠性等大量系統(tǒng)性設計工作?!?strong>王恩東院士用生動形象的比喻,詮釋了芯片到算力轉(zhuǎn)化過程中計算系統(tǒng)創(chuàng)新的價值所在。
以巨量模型為代表的巨量化是AI發(fā)展的重大趨勢
“人工智能如何發(fā)展出像人類具備邏輯、意識和推理的認知能力,是人工智能研究一直在探索的方向。目前來看,通過大規(guī)模數(shù)據(jù)訓練超大參數(shù)量的巨量模型,被認為是非常有希望實現(xiàn)通用人工智能的一個重要方向?!?strong>王恩東院士認為,隨著巨量模型的興起,巨量化已成為未來人工智能發(fā)展非常重要的一個趨勢。
目前,全球知名的AI領先公司在巨量模型上都予以重兵投入,谷歌、微軟、英偉達、浪潮、智源研究院、百度、阿里等公司相繼推出了各自的巨量模型。
巨量化的一個核心特征就是模型參數(shù)多、訓練數(shù)據(jù)量大。以浪潮人工智能研究院開發(fā)的全球最大規(guī)模的中文AI巨量模型“源1.0”為例,其參數(shù)量高達2457億,訓練數(shù)據(jù)集規(guī)模達到5000GB。相比GPT3模型的1750億參數(shù)量和570GB訓練數(shù)據(jù)集,“源1.0”的參數(shù)規(guī)模增加了40%,訓練數(shù)據(jù)集規(guī)模增加近10倍。
此外,巨量化也表現(xiàn)在模型應用規(guī)模大。互聯(lián)網(wǎng)頭部公司的AI開放平臺已經(jīng)吸引了超百萬的AI開發(fā)者,這些AI開放平臺每天承載著數(shù)萬億次的調(diào)用量,數(shù)百萬小時的語音識別,超過百億張圖像識別,超過萬億句自然語言理解等等。如此巨量的調(diào)用對算力中心的應用支撐能力帶來了極大的挑戰(zhàn)。
生態(tài)離散化制約AI上水平、上規(guī)模、上臺階
“很多人會有這樣的困惑,人工智能那么好,但是怎么跟我的業(yè)務、應用場景結(jié)合,想通過AI技術做智能化轉(zhuǎn)型,但是發(fā)現(xiàn)沒人懂算法,懂模型,也缺少好用的AI開發(fā)平臺。同時,算法模型那么多,如何找到不同算法在應用中的最優(yōu)組合?懂這些的人,往往都集中在科研機構(gòu)或者頭部公司。這些地方集中了最優(yōu)秀的AI人才,但缺少對傳統(tǒng)行業(yè)的需求場景、業(yè)務規(guī)律的深入理解?!?strong>王恩東院士對當前AI從技術到應用面臨的困局做了形象的概括。
來自埃森哲的一份調(diào)研報告顯示,70%以上有技術的研究機構(gòu)、科技公司缺需求場景、缺領域知識和數(shù)據(jù),70%以上的行業(yè)用戶缺技術人才、缺AI平臺和實踐能力。
與此同時,生態(tài)離散化也與AI芯片多元化的發(fā)展趨勢關系密切。目前,AI芯片架構(gòu)五花八門,指令集不同,無法兼容,而面向芯片的編程庫又跟芯片綁定,靈活性差。小公司只做了其中一個環(huán)節(jié),這造成生態(tài)的縱向不通;大公司希望構(gòu)建封閉的系統(tǒng),這造成了生態(tài)的橫向不通。
王恩東院士認為,目前人工智能的技術鏈條、產(chǎn)業(yè)鏈條是脫節(jié)的,生態(tài)離散化已成為制約人工智能技術上水平、應用上規(guī)模、產(chǎn)業(yè)上臺階的瓶頸所在。
多元化、巨量化、生態(tài)化給整個計算產(chǎn)業(yè)帶來的挑戰(zhàn)是空前的。“要想釋放多元算力價值、促進人工智能創(chuàng)新,一是要重視智算系統(tǒng)的創(chuàng)新,加大人工智能新型基礎設施建設,把從技術到應用的鏈條設計好,從體系結(jié)構(gòu)、芯片設計、系統(tǒng)設計、系統(tǒng)軟件、開發(fā)環(huán)境等各個領域形成既分工明確又協(xié)同創(chuàng)新的局面;二是要加快推動開放標準建設,通過統(tǒng)一的、規(guī)范的標準,將多元化算力轉(zhuǎn)變?yōu)榭烧{(diào)度的資源,讓算力好用、易用?!?strong>王恩東院士強調(diào)說。
雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。