0
本文作者: 林覺民 | 2023-11-13 08:12 |
趙亞雄認(rèn)為,算想未來的機(jī)會是堅持做好算力云服務(wù),讓望價興嘆的的企業(yè)不再是看客。
一、限制新規(guī)出臺,國內(nèi)進(jìn)口芯片受阻
今年10月17日,美國BIS發(fā)布了針對芯片的出口管制新規(guī),此次限制的核心對象是先進(jìn)計算半導(dǎo)體、半導(dǎo)體制造設(shè)備和超級計算機(jī)項目。
而事實上,此次新規(guī)是美國在去年10月發(fā)布的規(guī)定的基礎(chǔ)上修改更新后的版本,且將于2023年11月16日生效。這是繼2022年10月7日后,美國半導(dǎo)體出口管制的第二次升級。
時間回到去年10月份,當(dāng)時限制向中方銷售A100級別及以上顯卡,其中就包括H100。國內(nèi)企業(yè)為了擺脫限制,退而求其次,轉(zhuǎn)而采購降低H100芯片的變種芯片H800,還有A100的變種芯片A800。
對于今年的新規(guī),通過查詢官網(wǎng)信息了解到,主要包括三個規(guī)則:先進(jìn)的計算芯片規(guī)則,首先調(diào)整了決定先進(jìn)計算芯片是否受到限制的參數(shù);其次是采取新的措施來應(yīng)對規(guī)避控制的風(fēng)險,對另外40多個國家出口的產(chǎn)品實施了額外的許可證要求;
擴(kuò)大半導(dǎo)體制造設(shè)備的出口管控方面,包括強(qiáng)化對美國人才的限制,還增加了需要申請半導(dǎo)體制造設(shè)備許可證的國家數(shù)量,從中方擴(kuò)大到美國能夠管轄到的21個國家;
實體清單方面,先前的規(guī)定已經(jīng)把31家中國企業(yè)列入到實體清單,而新規(guī)則增加了壁仞13家中國企業(yè)名單,也就是說實體清單上已經(jīng)有40余家中國企業(yè)在列。
另外,除了限制高端芯片出口,公告里還提到了要限制中國制造高端芯片。這意味著可能會阻礙Applied Materials、Lam和KLA等公司向中國銷售半導(dǎo)體制造設(shè)備。
據(jù)悉,去年的禁令主要做了兩方面的限制:一是互聯(lián)帶寬,二是算力總量,而今年則取消了互聯(lián)帶寬的限制,增加了算力密度的限制,因為算力密度越高,芯片的制程和設(shè)計水平也就越高。這意味著不論英偉達(dá)還是英特爾、AMD,按照算力性能密度的要求,新產(chǎn)品可能基本沒有辦法對華供應(yīng)。
值得注意的是,對于一些略低于性能限制閾值的芯片,類似RTX 4090等。如果要出口到中國,也需要向BIS提交申請。由此可見,此次新規(guī)的下手較狠,圍堵也更為嚴(yán)格。
算想未來創(chuàng)始人趙亞雄表示,新規(guī)之前,國內(nèi)是可以通過公開渠道購買A800或者H800的。新規(guī)生效后,國內(nèi)企業(yè)沒辦法通過正規(guī)途徑買到A800和H800,甚至4090等低性能芯片都要向 BIS 提交申請。另外,他還談到,國內(nèi)英偉達(dá)代理商已經(jīng)停止了交付。
據(jù)海關(guān)公布的數(shù)據(jù)顯示,今年前三季度中國芯片進(jìn)口量同比減少14.6%,其中芯片進(jìn)口額減少了600多億美元,進(jìn)口額下滑19.8%。從相關(guān)數(shù)據(jù)也可以看出,中國進(jìn)口的高端芯片數(shù)量加速減少。
顯然,最新限制規(guī)則生效后,中國高端芯片進(jìn)口量還會呈現(xiàn)持續(xù)縮減的態(tài)勢。
二、清單企業(yè)遞增,國產(chǎn)AI芯片進(jìn)退兩難
新規(guī)究竟會給國內(nèi)外帶來什么樣的影響?
從新規(guī)中實體名單可以看出,中國企業(yè)的數(shù)量已經(jīng)從去年的30多家上升到了40多家,這就意味著海外對國內(nèi)芯片的限制更為嚴(yán)格且范圍仍在持續(xù)擴(kuò)大。
而此次又將13家企業(yè)列入到限制清單內(nèi),這無疑給了國內(nèi)AI芯片廠商一記重拳。對此,相關(guān)企業(yè)也紛紛發(fā)表聲明,表示強(qiáng)烈反對并提起申訴。
據(jù)公開材料顯示,BIRENTECH指出,公司嚴(yán)格遵守相關(guān)國家和地區(qū)的法律、法規(guī),并在此基礎(chǔ)上始終合法依規(guī)經(jīng)營,目前正在評估此事件可能對公司造成的影響,做好應(yīng)對工作,并將與各方面積極溝通。
MOORE THREADS也發(fā)布聲明,公司自成立以來嚴(yán)格遵守相關(guān)國家和地區(qū)的法律、法規(guī),始終秉持合法、合規(guī)的企業(yè)文化和管理理念,建立了完善的出口管制合規(guī)管理體系和工作流程指引。公司正在與各方積極溝通,對于該事項的影響正在評估。
對此,趙亞雄表示,這些公司需要花費大量的精力重新申請美國出口許可,證明自己的產(chǎn)品沒有用于美國所謂的出口管制上,美國技術(shù)不能應(yīng)用的場景中,諸如威脅美國的國家安全、研發(fā)其他殺傷性武器等。
這將是一個非常漫長且痛苦的過程,名單上的企業(yè)必須把自己的客戶和產(chǎn)品銷售路徑,目標(biāo)場景做詳細(xì)的說明,并列舉必要的證據(jù),提交到BIS,說明我沒有利用你的技術(shù)做違反規(guī)定的事情 。但是懷璧其罪,趙亞雄斷言BIS不會同意任何相應(yīng)企業(yè)的申請。
從目前來看,國內(nèi)這些大模型公司短期內(nèi)可以相安無事,靠存量芯片做訓(xùn)練。如字節(jié)曾在2021年向英偉達(dá)買了大量的芯片,騰訊、百度等大廠則已經(jīng)提前做好囤貨準(zhǔn)備,切對外宣稱有足夠的量來應(yīng)對此次管制的升級。
但從長遠(yuǎn)來看,國內(nèi)芯片需求很大程度上會變的更加嚴(yán)峻,大家會想各種不同的辦法規(guī)避,一種方法是“李代桃僵”,去新加坡或者東南亞,通過完全看不出來的,且沒有直接關(guān)聯(lián)的實體采購算力。
也就是說,非直接購買渠道在未來還會奏效。但是溢價以及風(fēng)險大幅上升。
但反觀國外市場,由于種種限制,水漲船高的現(xiàn)象只會越愈加嚴(yán)重,從公開銷售渠道看,6月29日,英偉達(dá)A800高配版80G版本的售價為95999元。7月中旬,英偉達(dá)代理商反饋,英偉達(dá)的A800 GPU單價漲至12萬元。
而英偉達(dá)A800推出之初,售價僅為7.4萬元,不一年的時間,該芯片單價漲了近5萬元。還伴有產(chǎn)能下降問題,目前A100/A800 已經(jīng)停產(chǎn),雖然不排除英偉達(dá)還會針對國內(nèi)市場生產(chǎn)閹割版,但英偉達(dá)已經(jīng)不再接收 A100/A800 訂單。
此外,低配版芯片也有類似的情況。據(jù)悉,一張H100計算卡制造成本為3320 美元,英偉達(dá)對外售價以2.5萬至3萬美元,毛利率高達(dá)1000%,且需求只增不減,H100已售罄缺貨到2024年。
也就是說,即使通過非直接渠道可以購買,但隨著價格的持續(xù)攀升,也會讓大多數(shù)廠商望而卻步。因為他們也要考慮成本問題,畢竟大模型需要長線作戰(zhàn),如果短期內(nèi)看不到效果的話,很多廠商可能會放棄。另外,即使國內(nèi)大廠有充足的預(yù)算,但由于產(chǎn)能下降,很有可能出現(xiàn)供不應(yīng)求的現(xiàn)象。
可以預(yù)見,限制的收緊會再次讓中國AI廠商限制進(jìn)退兩難的境地。
三、短期局勢難以判斷,長期大模型產(chǎn)業(yè)愈發(fā)樂觀
無論是去年的限制,還是今年出臺的新規(guī),能明顯感覺到美國在持續(xù)給中國進(jìn)口AI芯片施壓,但很大程度上也會倒逼中國芯片產(chǎn)業(yè)的發(fā)展。
首先,為了規(guī)避風(fēng)險,很大企業(yè)會轉(zhuǎn)向國產(chǎn)的芯片,這就能快速的帶動國產(chǎn)芯片的軟件生態(tài)的迭代,從而讓它可以快速的追上CUDA這套生態(tài)系統(tǒng)的成熟度,從而逐步替換掉英偉達(dá),或者說能真正能交付給用戶,越來越接近英偉達(dá)能力的產(chǎn)品。
其次,政府智算中心會釋放出大量的需求,大多數(shù)情況下,政府的智算中心要自負(fù)盈虧,之前他們是要采購一部分英偉達(dá),甚至以英偉達(dá)為主。但是現(xiàn)在在大環(huán)境的影響下,國家級的超算中心必須是國產(chǎn)的,相應(yīng)的地方政府采用國產(chǎn)芯片的比例也會提高,這是利好國產(chǎn)智算芯片的發(fā)展的。
再者,國內(nèi)的AI企業(yè)、GPU企業(yè)沒有坐以待斃,而是努力前行。他們試圖通過強(qiáng)大自身,以擺脫AI芯片被國外卡脖子的現(xiàn)象,且目前已經(jīng)取得了一系列成效。
據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的《中國半年度加速計算市場(2023上半年)跟蹤》報告顯示,受供應(yīng)鏈、政治等因素影響,中國市場面臨的算力缺口給國內(nèi)的芯片發(fā)展帶來新的機(jī)遇。
中國本土的AI芯片廠商發(fā)展正處于快速增長的階段。2023年上半年,中國加速芯片的市場規(guī)模超過50萬張。從技術(shù)角度看,GPU卡占有90%的市場份額;從品牌角度看,中國本土AI芯片品牌出貨超過5萬張,占比整個市場10%左右的份額。
目前英偉達(dá)的GPU在AI訓(xùn)練領(lǐng)域占據(jù)主要份額,英特爾、AMD正在搶奪市場。從國內(nèi)企業(yè)看,巨頭中華為、阿里、百度、騰訊都已經(jīng)有自研AI芯片,有的對外銷售、有的自用。
比如昇騰系列,已經(jīng)支持了國內(nèi)過半的AI大模型訓(xùn)練;百度旗下的昆侖芯片,瞄準(zhǔn)的是云端AI通用芯片;阿里已經(jīng)推出高性能推理AI芯片含光系列;騰訊自研的AI推理芯片紫霄,已經(jīng)量產(chǎn)并在騰訊會議等業(yè)務(wù)上落地。
但趙亞雄也坦言,國內(nèi)雖然已經(jīng)出現(xiàn)了性能不錯的芯片,諸如910B的水平已經(jīng)接近A100,沐曦MXC500能達(dá)到A100 70-90%的水平、寒武紀(jì)的最新一代硬件指標(biāo)上也接近A100。但只是硬件層面達(dá)到了,軟件層面還差的太遠(yuǎn)。
首先,從芯片設(shè)計的角度看,國內(nèi)頭部互聯(lián)網(wǎng)廠商的自研 AI 芯片是針對內(nèi)部的AI 算力的需求設(shè)計的,這就導(dǎo)致其芯片的通用性不強(qiáng)。比如百度傾向于用芯片適配其深度學(xué)習(xí)的推薦模型,它不會用到類似Transformer的架構(gòu),相應(yīng)的匹配度就不會足夠好。百度采購華為 910B 正是這個缺陷的例證。
而英偉達(dá)是在2007年就開始做GPU,發(fā)布了CUDA,已經(jīng)有十多年的驗證,首先有一個絕對量的優(yōu)勢,并經(jīng)過了長時間的驗證,現(xiàn)在的任何一家做大模型的企業(yè),必須要找一個經(jīng)過驗證且有成功案例的,才可以快速替代。否則就會面臨很大的風(fēng)險。顯然國內(nèi)企業(yè)在短時間內(nèi),沒辦法在絕對量上匹配同樣的投入,也就很難達(dá)到以CUDA為核心的AI軟件生態(tài)的水平。
再就是,國產(chǎn)AI芯片面臨著嚴(yán)峻的產(chǎn)能問題,大部分AI芯片只夠內(nèi)部使用,很難量產(chǎn),甚至比英偉達(dá)還要嚴(yán)重。
所以,毋庸置疑的是,短期內(nèi)海外仍會占據(jù)AI芯片的主導(dǎo)地位,而限制的持續(xù)收緊也會在短期內(nèi)拉大中美在大模型研究方面的差距,但是越早早上自主創(chuàng)新的道路,才能在新一輪以 AI 為主賽道的中美科技競賽中獲得制勝的根基。
四、算想未來堅持做好算力云服務(wù),讓望價興嘆的的企業(yè)不再是看客
從長遠(yuǎn)來看,只有解決好國產(chǎn)算力問題,研發(fā)出高性能的國產(chǎn)AI芯片,才有可能在這場競爭中占據(jù)有利地位,那該如何破局?
算想未來給出的答案是:聚焦AI底層基礎(chǔ)設(shè)施,堅持做好算力云服務(wù)。要做一個管理 AI超級計算機(jī)的基礎(chǔ)設(shè)施軟件平臺,將算力充分釋放給大模型做訓(xùn)練、推理。這個軟件平臺的核心技術(shù)能力體現(xiàn)在可擴(kuò)展性、效率兩個方面:
可擴(kuò)展性:大模型訓(xùn)練任務(wù)能從零 GPU 平滑擴(kuò)展到千卡(未來萬卡)規(guī)模
效率:大模型訓(xùn)練、推理任務(wù)的GPU使用率保持在60%以上
這兩方面的能力支持大模型智算集群的多用戶復(fù)用,提升訓(xùn)練過程中對硬件的使用效率,加速大模型訓(xùn)練的迭代速度,最終達(dá)到快速追趕 OpenAI 的目標(biāo)。
目前,算想未來已經(jīng)推出了算想云(llm.sxwl.ai):無服務(wù)器(Serverless)大模型訓(xùn)推云服務(wù))、三千平臺(私有化部署云原生大模型訓(xùn)推軟件平臺)、以及算想三千(大模型智算集群解決方案)。降低企業(yè)的落地大模型的算力價格門檻,讓想做大模型的企業(yè)不再是看客。
其一,算想云即無服務(wù)器(Serverless)大模型訓(xùn)推云服務(wù),主要服務(wù)于中小企業(yè)、開發(fā)者或者小的大模型團(tuán)隊,用戶可以按需使用,目前只支持訓(xùn)練,推理服務(wù)正在研發(fā)中。
而且為了降低大模型的準(zhǔn)入門檻,實現(xiàn)真正的普惠,算想云將以低于公有云 60% 價格釋放給小b 客戶。據(jù)了解,算想云上線后,初期會提供兩臺 A100 的服務(wù)器,后期會逐漸擴(kuò)容到10臺左右的規(guī)模,這樣用戶就可以獲得80卡的最大規(guī)模的算力資源。
值得注意的是,算想云(llm.sxwl.ai)將于北京時間 2023-11-13 10:00 正式上線,注冊用戶將免費獲得 5 分鐘 A100 GPU 時長(來自算想未來獨家算力合作伙伴),同時我們將從注冊用戶中抽出一位幸運(yùn)兒,贈送終身可用的 ¥10000/月算想云大模型算力券。
其二,三千平臺,因支持千卡 A100 或等效規(guī)模智算集群;支持千億參數(shù)大模型并行訓(xùn)練);支持千小時無人干預(yù)穩(wěn)定訓(xùn)練而得名,依托來自容器和云原生技術(shù)發(fā)源地 Google Borg 的技術(shù)經(jīng)驗打造,提升 GPU 服務(wù)器集群的資源使用率。算想云使用三千平臺管理第三方閑置智算集群。
據(jù)介紹,目前該平臺已經(jīng)完成了1.0 版本的研發(fā),并在合作伙伴的算力集群上完成了交付驗收。年底前會在千卡規(guī)模 A100 智算集群上測試驗證。
在此基礎(chǔ)上,算想三千是一套整合IB 和 RoCE組網(wǎng)方案,為零散的高端 GPU 服務(wù)器業(yè)主升級到大模型智算集群的解決方案。比如高校各實驗室購買高端 GPU 服務(wù)器,通過組網(wǎng)方案,獲得了大模型訓(xùn)練所需的高速網(wǎng)絡(luò)能力。此外,算想三千整合三千平臺、算想云,分別為升級后的智算集群提供云原生智算平臺、以及通過算想云變現(xiàn)的機(jī)會。算想未來團(tuán)隊的核心能力是為客戶進(jìn)行高階網(wǎng)絡(luò)功能的驗證以及優(yōu)化;相較于IB方案,RoCE方案的成本更低,主要在于后者有一個更開放的標(biāo)準(zhǔn),著意味著更多的第三方會根據(jù)標(biāo)準(zhǔn)來做,這樣會極大的降低成本。
目前,算想云、三千平臺以及算想云三者構(gòu)成了一整完整的大模型智算集群解決方案即“算想三千”。涵蓋了智算中心從建設(shè)、運(yùn)維管理,再到商業(yè)化變現(xiàn)三個重要的環(huán)節(jié)。
值得注意的是,算想三千主要聚焦政府和企業(yè)投資的智算中心中的“閑置算力”。
緣何如此?趙亞雄解釋道,閑置算力方面,目前備機(jī)數(shù)量占到計算集群總裝機(jī)量的 2% 到5%,閑置算力潛在的變現(xiàn)空間已經(jīng)變得非常大,比如現(xiàn)在大多數(shù)云廠商和算力池企業(yè)都有備機(jī)機(jī)制,目的是在出租裸金屬服務(wù)器時,當(dāng)裸金屬出現(xiàn)故障,可以快速地用備機(jī)服務(wù)器替代,算想云平臺上就可以幫助其直接變現(xiàn)。
據(jù)趙亞雄介紹, 如果這些限制算力全部用來變現(xiàn),以業(yè)界通常采用的五年折舊期來算智算中心通過備機(jī)可以增加 10-25% 的凈利潤。
而選擇政府智算中心的原因,主要在于早期政府的智算中心還有一定比例的英偉達(dá)芯片,如今迫于大環(huán)境的壓力,大多數(shù)企業(yè)可以規(guī)避,但政府只能采購國產(chǎn)芯片,我們希望和國產(chǎn)GPU 廠商合作共同研發(fā)一套供政府智算中心使用的解決方案,然后把這套解決方案輻射到更大的范圍。
談到未來的規(guī)劃,趙亞雄表示,進(jìn)入大模型這個賽道,算想未來本著只提供算力云服務(wù),
目的為了解放大模型的生產(chǎn)力給所有企業(yè)用戶,讓每個企業(yè)都擁有大模型工程能力,而不是依賴第三方的云服務(wù)以及其他的技術(shù)服務(wù)。
“因為我們只做算力,所以我們是平臺中立,不涉及采集用戶的數(shù)據(jù)或者自己構(gòu)建大模型的業(yè)務(wù),我們是利用自己在Google 等業(yè)界領(lǐng)先的云原生大模型智算平臺以及 AI 軟件優(yōu)化的技術(shù)經(jīng)驗,把現(xiàn)有AI芯片的算力充分挖掘,通過云原生容器平臺的方式釋放給企業(yè)用戶,且讓這些企業(yè)在低成本、高性價比的算力支撐下,通過大模型挖掘自有數(shù)據(jù)的商業(yè)價值“,趙亞雄如是說。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)雷峰網(wǎng)
雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。