超算發(fā)展的加速引擎，大模型推理成ASC24賽題

本文作者：何思思

2024-01-09 14:24

導語：ASC的第十二年。

談到超算，最早可追溯到1929年，彼時，超級計算（Supercomputing）的概念首次出現(xiàn)在《紐約世界報》的報道中，并對今后科技的發(fā)展起著至關重要的作用。隨后，國內外對超算的研究進入到了如火如荼的階段。

人材是創(chuàng)新的源泉，也是技術發(fā)展的主導力量，為了給中國超算產業(yè)持續(xù)儲備、輸送更多優(yōu)秀的技術人才，2012年，中國提議并成立了ASC世界大學生超級計算機競賽，該活動與日本、俄羅斯、韓國、新加坡、泰國、中國臺灣、中國香港等國家和地區(qū)的超算專家和機構共同發(fā)起并組織，并得到美國、歐洲等國家地區(qū)超算學者和組織的積極響應支持。

至今，ASC已經走過12個年頭，已經發(fā)展為全球最大規(guī)模的大學生超算競賽，超過上萬名大學生人才走入ASC，跨進超算的大門，通過以賽代學以賽促練快速成長，融為了產業(yè)創(chuàng)新的新鮮血液。

隨著超算技術不斷發(fā)展，中國超算應用領域也在不斷拓展，人才培養(yǎng)也得到產學研界的用心扶持。近幾年來，我國超算產業(yè)的發(fā)展取得了不錯的成績。

規(guī)模方面，據(jù)Frost & Sullivan的調研數(shù)據(jù)顯示，2016-2021年中國超算服務市場規(guī)模的復合增長率達24.7%，其中，2021年市場規(guī)模為196.6億元，2022年增速約24.5%，由此推算，2022年中國超算服務市場規(guī)模約244.8億元。

性能方面，中國超級計算平均性能已經從2013年的573 Tflops升至2022年的8999 Tflops。其中，2022年超級計算機最高性能達208260 Tflops，較2021年的最高性能提升了66.55%。

同時，結合超算近兩年的發(fā)展態(tài)勢，F(xiàn)rost & Sullivan也預測道，2022-2025年中國超算服務市場規(guī)模復合增速約24.1%，若持續(xù)保持這一增速發(fā)展，到2028年，中國超算服務市場規(guī)模將接近900億元。

緣何能保持如此高速的增長？

如果從今年科技界的發(fā)展動向看，大模型就是最好的“加速器”。

對此，一位超算行業(yè)的專業(yè)人士也曾提到，隨著2022年底ChatGPT的流行帶動，算力已成為大模型訓練的重要基礎設施，國內外紛紛建設由高端芯片組成的大規(guī)模算力集群。大模型訓練與推理為超算帶來了巨大機遇，據(jù)OpenAI估算，目前大模型訓練對算力的需求大約每3至4月翻一倍，遠超摩爾定律18至24個月翻倍的速度。

毫無疑問，大模型的發(fā)展確實能在很大程度上，帶動算力乃至超算產業(yè)的發(fā)展，但是其背后是對人才提出了更為嚴苛的要求。諸如，如何加速大模型的訓練速度？如何提升大模型的訓推性能？以及如何降低計算成本等這些問題都需要人來完成。

正如上海大學計算機工程與科學學院院長謝少榮所言，大模型給我們帶來機遇的同時，也帶來了巨大的挑戰(zhàn)，大模型對算力的需求不斷激增，隨之而來對人才也提出了新的要求，如何培養(yǎng)更高質量的人才，就成了重要的研究課題。

基于此，近日，2024 ASC世界大學生超級計算機競賽（ASC24）在北京全面啟動，吸引了全球超過300支高校隊伍報名參賽，較以往報名參加的國家和地區(qū)的數(shù)量都有較大的提升。

值得注意的是，此次的賽題包括大模型推理優(yōu)化、滲流數(shù)值模擬，以及國際通行基準測試HPL和HPCG等。

其中，在大模型推理優(yōu)化方面，ASC24選擇的是開源大模型LLaMA2。眾所周知，目前國內外涌現(xiàn)出了多個開源大模型，LLaMA2是充分評估和考量后的結果。智源研究院大模型行業(yè)應用負責人周華表示，LLaMA在整個開源界的認知度和成熟度都比較高，從參賽隊伍的角度來說，讓他們基于熟知的開源模型做預賽是一個比較好的選擇。

“在參數(shù)上，賽題選擇的是70B參數(shù)規(guī)模，體量足夠大，硬件配置方面是兩卡的機器，意味著一臺機器是跑不起來的，需要參賽隊伍做更多的優(yōu)化工作，這對于人才的選拔非常有必要的，”周華如是說。

ASC組委會委員劉軍補充道，“組委會在賽題的選擇上希望有一定的代表性和超前性?！?/span>

反觀過往幾年的賽題設置，似乎也在一直踐行這一標準。2016年，在賽題設置方面，和科大訊飛合作做過語音識別；2017年，和百度聯(lián)合做了飛槳自動駕駛的路徑規(guī)劃；2018年，和微軟共同做了數(shù)據(jù)集的閱讀理解評測，2019年，雖然大模型沒有爆火，但當時就使用了源大模型的賽題；去年，大模型領域出現(xiàn)了百花齊放的局面，從全球范圍看，LLaMA是具備領先性的。

當然，劉軍也坦言，ASC是一個全球性的競賽，各國的參賽隊伍在開源模型上開展相應的比賽工作，一方面，大家能獲取更廣泛的資源，諸如相應的論文或者代碼工作的支持，另一方面，同樣會考驗，各個參賽隊伍如何更加有效地獲取相關資源完成這次競賽。

在本次競賽中，還加入了滲流數(shù)值模的賽題，對此，雷峰網(公眾號：雷峰網)了解到，這類賽題，主要是研究多相流體在多孔介質中的復雜流動規(guī)律與特征，要求各參賽隊伍模擬石油開采場景中油、氣、水等多相流體的滲流情況，并優(yōu)化大規(guī)模并行計算過程，提升離散算法的計算性能和并行效率。滲流力學廣泛應用于環(huán)境保護、地震預報、生物醫(yī)療等領域的科學研究，以及防止治理地面沉降或海水入侵、興建大型水利水電工程、農林工程、凍土工程等工程技術中。

從賽題的設置方面，能明顯的看出，此次的賽題涉及范圍更為廣泛，這就意味著，考驗的不僅僅是大模型訓推等能力，還需要參賽隊伍具備工業(yè)、地質學、生物醫(yī)療等多個交叉學科的能力，這無疑會對參賽隊伍提出更為嚴峻的挑戰(zhàn)。

對此，中國科學院數(shù)學與系統(tǒng)科學研究院研究員張晨松解釋道，此次賽題牽扯的面確實比較廣，包含地質力學、流體力學、油藏工程等知識。所以在設計題目時，會盡量地把一些參賽人員可能不太會牽扯到的知識屏蔽掉，只選擇一部分程序，讓參賽隊伍把優(yōu)化的精力集中在一些算法的提升以及對固定算法的代碼性能的優(yōu)化方面。主要考察的則是計算機程序開發(fā)的能力以及在超算上并行資源利用的能力。

從一定程度上來說，ASC是為了給超算產業(yè)的發(fā)展持續(xù)輸送人才，但是反觀大模型給超算行業(yè)帶來的影響，其實，更重要的是怎么讓大模型在千行百業(yè)中成功落地。

周華表示，目前大模型的主要應用形式是客服或者文檔處理，在這些方面已經相對成熟了。但一旦進入深水區(qū)，比如工業(yè)領域涉及到的文字處理、圖表解析、工程數(shù)字等問題很難通過大模型來解決。

“總體來說，現(xiàn)階段的大模型還是一個知識量非常龐大，相對比較通才的偏文科的模型狀態(tài)。如果想要用在理工科領域，仍需要不斷加強模型的能力，特別是邏輯推理、數(shù)學等方面的能力。”

雷峰網原創(chuàng)文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏