0
9 月 2 日,無問芯穹(Infinigence AI)宣布完成近 5 億元 A 輪融資,本輪融資聯(lián)合領投方為社?;鹬嘘P村自主創(chuàng)新專項基金(君聯(lián)資本擔任管理人)、啟明創(chuàng)投和洪泰基金。
跟投方包括聯(lián)想創(chuàng)投、小米、軟通高科等戰(zhàn)略投資方,國開科創(chuàng)、上海人工智能產(chǎn)業(yè)投資基金(臨港科創(chuàng)投擔任管理人)、徐匯科創(chuàng)投等國資基金,以及順為資本、達晨財智、德同資本、尚勢資本、森若玉坤、申萬宏源、正景資本等財務機構(gòu)。
至此,無問芯穹的累計融資金額已達近10億元。
值得一提的是,其過往投資方還包括百度、智譜、同歌創(chuàng)投等戰(zhàn)略股東,以及紅杉中國、礪思資本、徐匯資本、北極光創(chuàng)投、真格基金等眾多知名投資機構(gòu)。
而對于本輪融資的使用方向,據(jù)無問芯穹戰(zhàn)略運營SVP 王夢菲介紹,首先,“最重要的方向還是技術(shù)的儲備,我們做的事情對人才密度要求高,所以在技術(shù)上會繼續(xù)做一些配置?!?/p>
其次,“是產(chǎn)品的商業(yè)化,雖然公司成立的時間還比較短,但我們在商業(yè)化上今年已經(jīng)有一些規(guī)?;氖杖肓耍髂陼M一步的擴大市場份額,所以也會在商業(yè)化上加重布局。”
最后,“是生態(tài)的建設,我們需要上下游模型廠商、芯片廠商,包括大客戶和這個產(chǎn)業(yè)鏈上的很多關鍵的甲方都能夠認可我們的生態(tài),所以在生態(tài)建設上我們也會繼續(xù)投入?!?/p>
AI模型算力的“超級放大器”
大模型能夠支撐的實際產(chǎn)業(yè)規(guī)模,取決于AI模型的實際可用算力,是一個壁壘更高、玩家更稀缺、價值量更高的領域。
基于對AI行業(yè)的深刻理解和長期實踐,無問芯穹判斷,大模型的實際可用算力不僅取決于芯片的理論算力,還可通過優(yōu)化系數(shù)放大算力利用效率,通過集群規(guī)模放大整體算力規(guī)模。
由此,無問芯穹提出“芯片算力×優(yōu)化系數(shù)(軟硬協(xié)同)×集群規(guī)模(多元異構(gòu))=AI模型算力”公式。
遵循這一公式,無問芯穹將通過軟硬件聯(lián)合優(yōu)化技術(shù),持續(xù)提升芯片算力在大模型任務中的利用率,并通過多元異構(gòu)算力適配技術(shù),提升集群算力利用率,擴大行業(yè)整體算力供給。
在軟硬件聯(lián)合優(yōu)化方面,當前大模型推理需求逐步高漲,無問芯穹通過自研的推理加速技術(shù)FlashDecoding++大幅提升主流硬件和異構(gòu)硬件的利用率,超越在先SOTA。
同時,完成了多個主流開源大模型在AMD、華為昇騰、壁仞、寒武紀、燧原、海光、天數(shù)智芯、沐曦、摩爾線程、NVIDIA等10余種計算卡上的適配,并在部分計算卡上實現(xiàn)了行業(yè)第一的推理加速成果。
基于這一方案取得的優(yōu)化效果,無問芯穹也與AMD簽署戰(zhàn)略合作,攜手推動商用AI應用的性能提升。
在多元異構(gòu)算力適配方面,7月,無問芯穹發(fā)布的大規(guī)模異構(gòu)分布式混合訓練系統(tǒng)HETHUB,是業(yè)內(nèi)首次在華為昇騰、天數(shù)智芯、沐曦、摩爾線程和AMD、NVIDIA共六種芯片“4+2”組合間實現(xiàn)了千卡規(guī)模的異構(gòu)算力混合訓練。
集群算力利用率最高達到97.6%,平均高出基準方案約30%,這意味著,在相同的多元芯片機房條件或者集群條件下,無問芯穹可將訓練總時長壓縮30%。
當前,無問芯穹主要聚焦于 GPU 異構(gòu),不過,除 GPU 架構(gòu)芯片外,當前市場上也出現(xiàn)了一些專用芯片。
對此,王夢菲向 AI 科技評論介紹表示,“未來可能會有很多專用場景的芯片,這方面我們也有在做一些布局和預研的工作,我們也對這個方向比較看好?!?/p>
打造Infini-AI異構(gòu)云平臺
近年來,國際上模型層與芯片層逐漸形成“雙頭收斂”格局,而中國的模型層與芯片層依然持續(xù)呈現(xiàn)由“M種模型”和“N種芯片”構(gòu)成的“M×N”格局。
然而,不同硬件平臺需要適配不同軟件棧和工具鏈,異構(gòu)芯片間長久存在著難以兼用的“生態(tài)豎井”現(xiàn)象。
隨著越來越多國產(chǎn)異構(gòu)算力芯片被應用于全國各地方算力集群,異構(gòu)算力難以被有效利用的問題日益嚴峻,逐漸成為中國大模型產(chǎn)業(yè)發(fā)展的瓶頸。
無問芯穹依托軟硬協(xié)同、多元異構(gòu)技術(shù)優(yōu)勢,已基于多元芯片算力底座打造出Infini-AI異構(gòu)云平臺。該平臺向下兼容多元異構(gòu)算力芯片,可有效激活全國各地沉睡異構(gòu)算力,現(xiàn)已運營的算力覆蓋全國15座城市。
此外,Infini-AI異構(gòu)云平臺還包含一站式AI平臺(AIStudio)和大模型服務平臺(GenStudio)。
據(jù)無問芯穹介紹,AIStudio一站式AI平臺為機器學習開發(fā)者提供高性價比的開發(fā)調(diào)試、分布式訓練與高性能推理工具,覆蓋從數(shù)據(jù)托管、代碼開發(fā)、模型訓練、模型部署的全生命周期。
而GenStudio大模型服務平臺則為大模型應用開發(fā)者提供高性能、易上手、安全可靠的多場景大模型服務,全面覆蓋了從大模型開發(fā)到服務化部署的全流程,有效降低了開發(fā)成本和門檻。
自平臺上線以來,已有Kimi、LiblibAI、獵聘、生數(shù)科技、智譜AI等多個大模型行業(yè)頭部客戶在Infini-AI異構(gòu)云平臺上穩(wěn)定使用異構(gòu)算力,并享受無問芯穹提供的大模型開發(fā)工具鏈服務。
大模型時代的“算力運營商”
無問芯穹構(gòu)建的 Infini-AI異構(gòu)云平臺不僅可幫助下游客戶屏蔽硬件差異,高效使用底層異構(gòu)算力的強大能力,還將有力打破國內(nèi)異構(gòu)算力的生態(tài)困境,加速上層應用逐漸向異構(gòu)算力基座遷移,有效整合并擴大國內(nèi)大模型產(chǎn)業(yè)可用算力的規(guī)模,將異構(gòu)算力轉(zhuǎn)化為能用、夠用、好用的大算力,助力構(gòu)建具有中國特色的本土化異構(gòu)算力生態(tài)。
遵循算力利用率提升思路,結(jié)合軟硬件聯(lián)合優(yōu)化實力,無問芯穹在端側(cè)大模型和LPU IP領域亦有所布局,致力打造“端模型+端芯片”閉環(huán)能力。
無問芯穹堅信端側(cè)場景快速增長和應用爆發(fā)的必然趨勢,AI PC、AI手機將成為未來人機交互的重要接口,將助力每一個終端實現(xiàn)AGI級別的智能涌現(xiàn)。
以“釋放無穹算力,讓AGI觸手可及”為使命,無問芯穹致力于成為大模型時代首選的“算力運營商”,目前正在強力推進和產(chǎn)業(yè)鏈中最具價值的客戶建立戰(zhàn)略合作,再推廣到更廣泛的市場中實現(xiàn)標準化、批量化復制,建立規(guī)模優(yōu)勢。
通過激活多元異構(gòu)算力和軟硬件聯(lián)合優(yōu)化,無問芯穹目標讓大模型的落地成本降低10000倍,如同“水電煤”一般,成為行業(yè)觸手可及、廣泛受益的新質(zhì)生產(chǎn)力,加速AGI的普惠進程。
而“算力運營商”的定位也意味著無問芯穹與國內(nèi) AI Infra 企業(yè)存在較大差異性。
無問芯穹聯(lián)合創(chuàng)始人、CEO 夏立雪在接受 AI 科技評論等媒體采訪時表示,“我們認為在國內(nèi)AI Infra往往會被大家理解為比較單點優(yōu)化工具或軟件。在過往的很多實踐當中,證明了這一類的商業(yè)模式在國內(nèi)其實存在著一些難題?!?/p>
夏立雪認為,“從客戶的視角出發(fā),他們并不期望我們僅僅提供單一的工具解決方案,再由他們自行整合??蛻粽嬲胍氖且环N已經(jīng)優(yōu)化完善、即插即用的算力服務。因此,我們的工作定位為一步到位的滿足客戶需求,減少他們對技術(shù)細節(jié)差異的理解負擔?!?/p>
同時,“技術(shù)PK或者和客戶講誰的技術(shù)更好并不是最優(yōu)的方案,我們希望的是致力于把算力做到足夠的標準化,降低客戶使用算力的難度和門檻。這也是我們跟市面上一些AI Infra初創(chuàng)公司從愿景上的區(qū)別?!毕牧⒀┻M一步說道。
值得一提的是,從海外 AI Infra 公司方面對比,王夢菲也表示,“我們實際上是無法直接對標海外其他公司的,我們所做的事情和我們的商業(yè)模式是比較符合中國國情的,另外中國的客戶更希望面向的是All in one平臺,而非專業(yè)化、細致化,每人只做其中一部分這樣的平臺?!?span style="color: #FFFFFF;">雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。