0
談到超算,最早可追溯到1929年,彼時(shí),超級計(jì)算(Supercomputing)的概念首次出現(xiàn)在《紐約世界報(bào)》的報(bào)道中,并對今后科技的發(fā)展起著至關(guān)重要的作用。隨后,國內(nèi)外對超算的研究進(jìn)入到了如火如荼的階段。
人材是創(chuàng)新的源泉,也是技術(shù)發(fā)展的主導(dǎo)力量,為了給中國超算產(chǎn)業(yè)持續(xù)儲備、輸送更多優(yōu)秀的技術(shù)人才,2012年,中國提議并成立了ASC世界大學(xué)生超級計(jì)算機(jī)競賽,該活動(dòng)與日本、俄羅斯、韓國、新加坡、泰國、中國臺灣、中國香港等國家和地區(qū)的超算專家和機(jī)構(gòu)共同發(fā)起并組織,并得到美國、歐洲等國家地區(qū)超算學(xué)者和組織的積極響應(yīng)支持。
至今,ASC已經(jīng)走過12個(gè)年頭,已經(jīng)發(fā)展為全球最大規(guī)模的大學(xué)生超算競賽,超過上萬名大學(xué)生人才走入ASC,跨進(jìn)超算的大門,通過以賽代學(xué)以賽促練快速成長,融為了產(chǎn)業(yè)創(chuàng)新的新鮮血液。
隨著超算技術(shù)不斷發(fā)展,中國超算應(yīng)用領(lǐng)域也在不斷拓展,人才培養(yǎng)也得到產(chǎn)學(xué)研界的用心扶持。近幾年來,我國超算產(chǎn)業(yè)的發(fā)展取得了不錯(cuò)的成績。
規(guī)模方面,據(jù)Frost & Sullivan的調(diào)研數(shù)據(jù)顯示,2016-2021年中國超算服務(wù)市場規(guī)模的復(fù)合增長率達(dá)24.7%,其中,2021年市場規(guī)模為196.6億元,2022年增速約24.5%,由此推算,2022年中國超算服務(wù)市場規(guī)模約244.8億元。
性能方面,中國超級計(jì)算平均性能已經(jīng)從2013年的573 Tflops升至2022年的8999 Tflops。其中,2022年超級計(jì)算機(jī)最高性能達(dá)208260 Tflops,較2021年的最高性能提升了66.55%。
同時(shí),結(jié)合超算近兩年的發(fā)展態(tài)勢,F(xiàn)rost & Sullivan也預(yù)測道,2022-2025年中國超算服務(wù)市場規(guī)模復(fù)合增速約24.1%,若持續(xù)保持這一增速發(fā)展,到2028年,中國超算服務(wù)市場規(guī)模將接近900億元。
緣何能保持如此高速的增長?
如果從今年科技界的發(fā)展動(dòng)向看,大模型就是最好的“加速器”。
對此,一位超算行業(yè)的專業(yè)人士也曾提到,隨著2022年底ChatGPT的流行帶動(dòng),算力已成為大模型訓(xùn)練的重要基礎(chǔ)設(shè)施,國內(nèi)外紛紛建設(shè)由高端芯片組成的大規(guī)模算力集群。大模型訓(xùn)練與推理為超算帶來了巨大機(jī)遇,據(jù)OpenAI估算,目前大模型訓(xùn)練對算力的需求大約每3至4月翻一倍,遠(yuǎn)超摩爾定律18至24個(gè)月翻倍的速度。
毫無疑問,大模型的發(fā)展確實(shí)能在很大程度上,帶動(dòng)算力乃至超算產(chǎn)業(yè)的發(fā)展,但是其背后是對人才提出了更為嚴(yán)苛的要求。諸如,如何加速大模型的訓(xùn)練速度?如何提升大模型的訓(xùn)推性能?以及如何降低計(jì)算成本等這些問題都需要人來完成。
正如上海大學(xué)計(jì)算機(jī)工程與科學(xué)學(xué)院院長謝少榮所言,大模型給我們帶來機(jī)遇的同時(shí),也帶來了巨大的挑戰(zhàn),大模型對算力的需求不斷激增,隨之而來對人才也提出了新的要求,如何培養(yǎng)更高質(zhì)量的人才,就成了重要的研究課題。
基于此,近日,2024 ASC世界大學(xué)生超級計(jì)算機(jī)競賽(ASC24)在北京全面啟動(dòng),吸引了全球超過300支高校隊(duì)伍報(bào)名參賽,較以往報(bào)名參加的國家和地區(qū)的數(shù)量都有較大的提升。
值得注意的是,此次的賽題包括大模型推理優(yōu)化、滲流數(shù)值模擬,以及國際通行基準(zhǔn)測試HPL和HPCG等。
其中,在大模型推理優(yōu)化方面,ASC24選擇的是開源大模型LLaMA2。眾所周知,目前國內(nèi)外涌現(xiàn)出了多個(gè)開源大模型,LLaMA2是充分評估和考量后的結(jié)果。智源研究院大模型行業(yè)應(yīng)用負(fù)責(zé)人周華表示,LLaMA在整個(gè)開源界的認(rèn)知度和成熟度都比較高,從參賽隊(duì)伍的角度來說,讓他們基于熟知的開源模型做預(yù)賽是一個(gè)比較好的選擇。
“在參數(shù)上,賽題選擇的是70B參數(shù)規(guī)模,體量足夠大,硬件配置方面是兩卡的機(jī)器,意味著一臺機(jī)器是跑不起來的,需要參賽隊(duì)伍做更多的優(yōu)化工作,這對于人才的選拔非常有必要的,”周華如是說。
ASC組委會委員劉軍補(bǔ)充道,“組委會在賽題的選擇上希望有一定的代表性和超前性?!?/span>
反觀過往幾年的賽題設(shè)置,似乎也在一直踐行這一標(biāo)準(zhǔn)。2016年,在賽題設(shè)置方面,和科大訊飛合作做過語音識別;2017年,和百度聯(lián)合做了飛槳自動(dòng)駕駛的路徑規(guī)劃;2018年,和微軟共同做了數(shù)據(jù)集的閱讀理解評測,2019年,雖然大模型沒有爆火,但當(dāng)時(shí)就使用了源大模型的賽題;去年,大模型領(lǐng)域出現(xiàn)了百花齊放的局面,從全球范圍看,LLaMA是具備領(lǐng)先性的。
當(dāng)然,劉軍也坦言,ASC是一個(gè)全球性的競賽,各國的參賽隊(duì)伍在開源模型上開展相應(yīng)的比賽工作,一方面,大家能獲取更廣泛的資源,諸如相應(yīng)的論文或者代碼工作的支持,另一方面,同樣會考驗(yàn),各個(gè)參賽隊(duì)伍如何更加有效地獲取相關(guān)資源完成這次競賽。
在本次競賽中,還加入了滲流數(shù)值模的賽題,對此,雷峰網(wǎng)(公眾號:雷峰網(wǎng))了解到,這類賽題,主要是研究多相流體在多孔介質(zhì)中的復(fù)雜流動(dòng)規(guī)律與特征,要求各參賽隊(duì)伍模擬石油開采場景中油、氣、水等多相流體的滲流情況,并優(yōu)化大規(guī)模并行計(jì)算過程,提升離散算法的計(jì)算性能和并行效率。滲流力學(xué)廣泛應(yīng)用于環(huán)境保護(hù)、地震預(yù)報(bào)、生物醫(yī)療等領(lǐng)域的科學(xué)研究,以及防止治理地面沉降或海水入侵、興建大型水利水電工程、農(nóng)林工程、凍土工程等工程技術(shù)中。
從賽題的設(shè)置方面,能明顯的看出,此次的賽題涉及范圍更為廣泛,這就意味著,考驗(yàn)的不僅僅是大模型訓(xùn)推等能力,還需要參賽隊(duì)伍具備工業(yè)、地質(zhì)學(xué)、生物醫(yī)療等多個(gè)交叉學(xué)科的能力,這無疑會對參賽隊(duì)伍提出更為嚴(yán)峻的挑戰(zhàn)。
對此,中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院研究員張晨松解釋道,此次賽題牽扯的面確實(shí)比較廣,包含地質(zhì)力學(xué)、流體力學(xué)、油藏工程等知識。所以在設(shè)計(jì)題目時(shí),會盡量地把一些參賽人員可能不太會牽扯到的知識屏蔽掉,只選擇一部分程序,讓參賽隊(duì)伍把優(yōu)化的精力集中在一些算法的提升以及對固定算法的代碼性能的優(yōu)化方面。主要考察的則是計(jì)算機(jī)程序開發(fā)的能力以及在超算上并行資源利用的能力。
從一定程度上來說,ASC是為了給超算產(chǎn)業(yè)的發(fā)展持續(xù)輸送人才,但是反觀大模型給超算行業(yè)帶來的影響,其實(shí),更重要的是怎么讓大模型在千行百業(yè)中成功落地。
周華表示,目前大模型的主要應(yīng)用形式是客服或者文檔處理,在這些方面已經(jīng)相對成熟了。但一旦進(jìn)入深水區(qū),比如工業(yè)領(lǐng)域涉及到的文字處理、圖表解析、工程數(shù)字等問題很難通過大模型來解決。
“總體來說,現(xiàn)階段的大模型還是一個(gè)知識量非常龐大,相對比較通才的偏文科的模型狀態(tài)。如果想要用在理工科領(lǐng)域,仍需要不斷加強(qiáng)模型的能力,特別是邏輯推理、數(shù)學(xué)等方面的能力?!?/span>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。