0
談到超算,最早可追溯到1929年,彼時,超級計算(Supercomputing)的概念首次出現(xiàn)在《紐約世界報》的報道中,并對今后科技的發(fā)展起著至關(guān)重要的作用。隨后,國內(nèi)外對超算的研究進入到了如火如荼的階段。
人材是創(chuàng)新的源泉,也是技術(shù)發(fā)展的主導力量,為了給中國超算產(chǎn)業(yè)持續(xù)儲備、輸送更多優(yōu)秀的技術(shù)人才,2012年,中國提議并成立了ASC世界大學生超級計算機競賽,該活動與日本、俄羅斯、韓國、新加坡、泰國、中國臺灣、中國香港等國家和地區(qū)的超算專家和機構(gòu)共同發(fā)起并組織,并得到美國、歐洲等國家地區(qū)超算學者和組織的積極響應(yīng)支持。
至今,ASC已經(jīng)走過12個年頭,已經(jīng)發(fā)展為全球最大規(guī)模的大學生超算競賽,超過上萬名大學生人才走入ASC,跨進超算的大門,通過以賽代學以賽促練快速成長,融為了產(chǎn)業(yè)創(chuàng)新的新鮮血液。
隨著超算技術(shù)不斷發(fā)展,中國超算應(yīng)用領(lǐng)域也在不斷拓展,人才培養(yǎng)也得到產(chǎn)學研界的用心扶持。近幾年來,我國超算產(chǎn)業(yè)的發(fā)展取得了不錯的成績。
規(guī)模方面,據(jù)Frost & Sullivan的調(diào)研數(shù)據(jù)顯示,2016-2021年中國超算服務(wù)市場規(guī)模的復合增長率達24.7%,其中,2021年市場規(guī)模為196.6億元,2022年增速約24.5%,由此推算,2022年中國超算服務(wù)市場規(guī)模約244.8億元。
性能方面,中國超級計算平均性能已經(jīng)從2013年的573 Tflops升至2022年的8999 Tflops。其中,2022年超級計算機最高性能達208260 Tflops,較2021年的最高性能提升了66.55%。
同時,結(jié)合超算近兩年的發(fā)展態(tài)勢,F(xiàn)rost & Sullivan也預(yù)測道,2022-2025年中國超算服務(wù)市場規(guī)模復合增速約24.1%,若持續(xù)保持這一增速發(fā)展,到2028年,中國超算服務(wù)市場規(guī)模將接近900億元。
緣何能保持如此高速的增長?
如果從今年科技界的發(fā)展動向看,大模型就是最好的“加速器”。
對此,一位超算行業(yè)的專業(yè)人士也曾提到,隨著2022年底ChatGPT的流行帶動,算力已成為大模型訓練的重要基礎(chǔ)設(shè)施,國內(nèi)外紛紛建設(shè)由高端芯片組成的大規(guī)模算力集群。大模型訓練與推理為超算帶來了巨大機遇,據(jù)OpenAI估算,目前大模型訓練對算力的需求大約每3至4月翻一倍,遠超摩爾定律18至24個月翻倍的速度。
毫無疑問,大模型的發(fā)展確實能在很大程度上,帶動算力乃至超算產(chǎn)業(yè)的發(fā)展,但是其背后是對人才提出了更為嚴苛的要求。諸如,如何加速大模型的訓練速度?如何提升大模型的訓推性能?以及如何降低計算成本等這些問題都需要人來完成。
正如上海大學計算機工程與科學學院院長謝少榮所言,大模型給我們帶來機遇的同時,也帶來了巨大的挑戰(zhàn),大模型對算力的需求不斷激增,隨之而來對人才也提出了新的要求,如何培養(yǎng)更高質(zhì)量的人才,就成了重要的研究課題。
基于此,近日,2024 ASC世界大學生超級計算機競賽(ASC24)在北京全面啟動,吸引了全球超過300支高校隊伍報名參賽,較以往報名參加的國家和地區(qū)的數(shù)量都有較大的提升。
值得注意的是,此次的賽題包括大模型推理優(yōu)化、滲流數(shù)值模擬,以及國際通行基準測試HPL和HPCG等。
其中,在大模型推理優(yōu)化方面,ASC24選擇的是開源大模型LLaMA2。眾所周知,目前國內(nèi)外涌現(xiàn)出了多個開源大模型,LLaMA2是充分評估和考量后的結(jié)果。智源研究院大模型行業(yè)應(yīng)用負責人周華表示,LLaMA在整個開源界的認知度和成熟度都比較高,從參賽隊伍的角度來說,讓他們基于熟知的開源模型做預(yù)賽是一個比較好的選擇。
“在參數(shù)上,賽題選擇的是70B參數(shù)規(guī)模,體量足夠大,硬件配置方面是兩卡的機器,意味著一臺機器是跑不起來的,需要參賽隊伍做更多的優(yōu)化工作,這對于人才的選拔非常有必要的,”周華如是說。
ASC組委會委員劉軍補充道,“組委會在賽題的選擇上希望有一定的代表性和超前性?!?/span>
反觀過往幾年的賽題設(shè)置,似乎也在一直踐行這一標準。2016年,在賽題設(shè)置方面,和科大訊飛合作做過語音識別;2017年,和百度聯(lián)合做了飛槳自動駕駛的路徑規(guī)劃;2018年,和微軟共同做了數(shù)據(jù)集的閱讀理解評測,2019年,雖然大模型沒有爆火,但當時就使用了源大模型的賽題;去年,大模型領(lǐng)域出現(xiàn)了百花齊放的局面,從全球范圍看,LLaMA是具備領(lǐng)先性的。
當然,劉軍也坦言,ASC是一個全球性的競賽,各國的參賽隊伍在開源模型上開展相應(yīng)的比賽工作,一方面,大家能獲取更廣泛的資源,諸如相應(yīng)的論文或者代碼工作的支持,另一方面,同樣會考驗,各個參賽隊伍如何更加有效地獲取相關(guān)資源完成這次競賽。
在本次競賽中,還加入了滲流數(shù)值模的賽題,對此,雷峰網(wǎng)(公眾號:雷峰網(wǎng))了解到,這類賽題,主要是研究多相流體在多孔介質(zhì)中的復雜流動規(guī)律與特征,要求各參賽隊伍模擬石油開采場景中油、氣、水等多相流體的滲流情況,并優(yōu)化大規(guī)模并行計算過程,提升離散算法的計算性能和并行效率。滲流力學廣泛應(yīng)用于環(huán)境保護、地震預(yù)報、生物醫(yī)療等領(lǐng)域的科學研究,以及防止治理地面沉降或海水入侵、興建大型水利水電工程、農(nóng)林工程、凍土工程等工程技術(shù)中。
從賽題的設(shè)置方面,能明顯的看出,此次的賽題涉及范圍更為廣泛,這就意味著,考驗的不僅僅是大模型訓推等能力,還需要參賽隊伍具備工業(yè)、地質(zhì)學、生物醫(yī)療等多個交叉學科的能力,這無疑會對參賽隊伍提出更為嚴峻的挑戰(zhàn)。
對此,中國科學院數(shù)學與系統(tǒng)科學研究院研究員張晨松解釋道,此次賽題牽扯的面確實比較廣,包含地質(zhì)力學、流體力學、油藏工程等知識。所以在設(shè)計題目時,會盡量地把一些參賽人員可能不太會牽扯到的知識屏蔽掉,只選擇一部分程序,讓參賽隊伍把優(yōu)化的精力集中在一些算法的提升以及對固定算法的代碼性能的優(yōu)化方面。主要考察的則是計算機程序開發(fā)的能力以及在超算上并行資源利用的能力。
從一定程度上來說,ASC是為了給超算產(chǎn)業(yè)的發(fā)展持續(xù)輸送人才,但是反觀大模型給超算行業(yè)帶來的影響,其實,更重要的是怎么讓大模型在千行百業(yè)中成功落地。
周華表示,目前大模型的主要應(yīng)用形式是客服或者文檔處理,在這些方面已經(jīng)相對成熟了。但一旦進入深水區(qū),比如工業(yè)領(lǐng)域涉及到的文字處理、圖表解析、工程數(shù)字等問題很難通過大模型來解決。
“總體來說,現(xiàn)階段的大模型還是一個知識量非常龐大,相對比較通才的偏文科的模型狀態(tài)。如果想要用在理工科領(lǐng)域,仍需要不斷加強模型的能力,特別是邏輯推理、數(shù)學等方面的能力?!?/span>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。