0
作者 | 包永剛
編輯 | 王亞峰
與三四年前國內(nèi)云端AI芯片公司們在發(fā)布會的PPT上超越英偉達的豪言壯志形成鮮明對比,如今這些公司在現(xiàn)實里到處碰壁,許多連北都找不著。
“剛過完年,我們把芯片送到客戶那里測試時,才發(fā)現(xiàn)我們的軟件根本沒辦法滿足客戶應(yīng)用場景的需求,因為有些功能設(shè)計的時候就沒考慮到,我們當(dāng)場就傻眼了。”
這還是擁有AI芯片的公司才能感受到的痛楚,產(chǎn)品還沒出來的公司,在2022年的資本寒冬里,奮力融資。
“我只能用腥風(fēng)血雨來形容搶融資的可怕。”目睹AI芯片公司間爭搶融資的從業(yè)者露西說,“為了能夠拿到融資,有些初創(chuàng)公司寫抹黑競爭對手的盡調(diào)報告,再單獨發(fā)給投資人阻礙競爭對手融資。”
當(dāng)然,為了拿到融資,還有AI芯片公司講起了GPU的新故事。
“不懂的人不會投了,真正懂的人只會投真能落地的AI芯片公司。”這幾乎是業(yè)界的共識。
但云端AI芯片公司們落地的時候,才真切體會到設(shè)計出芯片只拿到了“入場券”,才真切體會到軟件有多難做。
現(xiàn)實讓云端AI芯片創(chuàng)業(yè)者們更加心知肚明的是,不要說超越英偉達,賣出一張AI加速卡才是最現(xiàn)實的目標(biāo)。
這就留下了一個值得深思的問題,如果AI芯片的參與者們和投資人們都只是想賺快錢,那狂歡結(jié)束能給國內(nèi)半導(dǎo)體產(chǎn)業(yè)留下什么?
資本寒冬里,為搶融資不擇手段
對于單款芯片開發(fā)成本就高達數(shù)億元,每年員工的薪資支出高達上億元的大芯片創(chuàng)業(yè)公司,大量融資成為了活下去的關(guān)鍵?!?strong>擁有更多融資,就有更大熬死競爭對手的機會,最終就能活下來。”數(shù)位投資界和芯片業(yè)界的人都對雷峰網(wǎng)說。
融資能力成為了一家大芯片創(chuàng)業(yè)公司掌舵人重要的能力,在2022年的資本寒冬里,就更加考驗大芯片公司的創(chuàng)始人們。
“市場上的資金是有限的,為了能夠獲得融資,除了拼實力,有的公司也耍起了手段?!甭段饔行嵖盀榱俗璧K競爭對手融資,一家芯片公司找競爭對手公司的離職員工挖黑料,找第三方機構(gòu)出一份盡調(diào)報告一對一發(fā)給投資人,投資人收到盡調(diào)報告后質(zhì)疑其可信度,找撰寫報告的機構(gòu)確認(rèn),機構(gòu)支支吾吾回復(fù)說是實習(xí)生寫的,這種手段有些拙劣?!?/p>
這家為了搶融資的GPGPU(通用圖形處理器,屬于AI芯片的一類)初創(chuàng)公司不擇手段其實也容易理解,畢竟作為為數(shù)不多還沒正式發(fā)布產(chǎn)品的公司,處境尷尬,為了拿到參賽入場券,只能先拿融資,特別是在投資人愈加謹(jǐn)慎和理性的2022年。
“還好當(dāng)時創(chuàng)始人‘騙’了我們,如果當(dāng)時創(chuàng)始人特別理智的給我們分析投資大芯片創(chuàng)業(yè)的風(fēng)險,我們也不敢投大芯片?,F(xiàn)在我們也‘上船’了,就大家一起劃船。”一位回過味的AI芯片投資人在2022年變得更加謹(jǐn)慎。
這與幾年前的情況大不相同。
“在AI大熱的2016年前后,AI芯片公司創(chuàng)始人甚至連完整的商業(yè)計劃書都沒有就能獲得幾億融資。后來,AI芯片公司的創(chuàng)始人靠著在PPT上超越英偉達也能獲得融資。但到了如今,投資人不僅要看產(chǎn)品,還要看芯片的MLPerf Benchmark(一套用于測量和提高機器學(xué)習(xí)軟硬件性能的通用基準(zhǔn)),更實際的投資人直接看芯片落地的訂單的發(fā)票?!盇I芯片從業(yè)者張偉(化名)看得很清楚。
“陪AI芯片初創(chuàng)公司真正跑出來難度太大了,即便我們天使輪就投資了一家非常有潛力的AI芯片公司,他們的產(chǎn)品也在落地過程中,但是高估值沒有足夠的支撐,對我來說是一個很大的壓力,我們在考慮退出。”投資了多個早期項目的投資人王軍(化名)表達了自己真實的想法。
關(guān)于AI芯片公司的估值,放棄投資AI芯片初創(chuàng)公司的投資人Blake說,“給AI芯片公司估值沒有一個很好的錨,提高或者降低50%都可以,這對投資人而言算不上好機會?!?/p>
為什么資本還是涌入了AI云端芯片領(lǐng)域?“一個是賽道邏輯,看到英偉達生意好、市值高就投資。另一個是一級市場投資人抱團。還有就是很多投資人并不專業(yè),特別是跨領(lǐng)域的投資人和機構(gòu)?!盉lake認(rèn)為。
實際上,不止是沒有產(chǎn)品的公司在搶融資,有產(chǎn)品但資金緊張的AI芯片公司也參與了“搶融資”。
起個大早,趕了個晚集的「早鳥」
說來有趣,有產(chǎn)品但還要搶融資的公司A此前面臨過一次融資危機,公司的兩次動蕩為這家公司的前景蒙上一層陰影。另一家起個大早的AI芯片初創(chuàng)公司B早早準(zhǔn)備好產(chǎn)品,卻被困在了軟件里,先發(fā)優(yōu)勢消耗殆盡。
兩家起了大早趕了晚集的AI芯片公司,一個從公司經(jīng)營的維度,另一個從產(chǎn)品的維度,展現(xiàn)了大芯片創(chuàng)業(yè)的巨大挑戰(zhàn)。
兩次動蕩,前途未卜
A公司成立很早,2018年就發(fā)布了首款產(chǎn)品,占據(jù)了先發(fā)優(yōu)勢,但這家公司的前員工向雷峰網(wǎng)(公眾號:雷峰網(wǎng))透露,在公司發(fā)布首款產(chǎn)品的一年多之后,融資一直處于B輪,融資進度跟不上研發(fā)需求,于是開始縮減業(yè)務(wù)、欠薪、裁員,連CEO也被“裁”了。
A公司的前員工透露,“那次的大變動,公司只保留了芯片團隊,公司管理層和業(yè)務(wù)大洗牌。不過融資也只是公司動蕩的其中一個因素,實際是各種因素的共同作用?!?/p>
業(yè)界的說法是,這家公司的CEO和聯(lián)合創(chuàng)始人在技術(shù)路線上理念不合,聯(lián)合創(chuàng)始人和投資人一起讓CEO出局。
創(chuàng)始人被踢出局的戲碼算不上新鮮,但不幸的是公司的關(guān)鍵人物變動似乎成了這家公司的“劫”。
A公司在第一次動蕩之后重整旗鼓,發(fā)布了新產(chǎn)品,迎來新的掌舵人,正當(dāng)一切都重回正軌之時,再次遭遇動蕩。
“A公司新任CEO氣焰有些囂張,聲稱某公司的項目勢在必得,2022年能落地2億的項目。”多位AI芯片業(yè)界人士都向雷峰網(wǎng)提及。
但這位經(jīng)驗豐富的CEO還沒實際創(chuàng)造2億的營收就遭遇了調(diào)查。
“一時間,香餑餑CEO好像成了燙手山芋,不說2億,不知道A公司今年能不能實現(xiàn)幾千萬的營收?”這成了同行會關(guān)注的話題。
每代產(chǎn)品不同樣,沒有高質(zhì)量落地項目
A公司因為人的因素沒能占盡先機之時,B公司被局限在了創(chuàng)始團隊的認(rèn)知里。
“軟件做的真的太差,客戶沒辦法用起來,自然難落地?!睅孜籅公司前員工以及業(yè)內(nèi)同行都如此評價。
軟件沒做起來,是因為硬件設(shè)計也有問題。
“B公司的芯片迭代到了第三代,但每一代芯片架構(gòu)思路都在變,甚至首席架構(gòu)師都不同,設(shè)計出的硬件微架構(gòu)也有很大的不同,硬件架構(gòu)沒有延續(xù)性,就算軟件的工程師再努力,軟件也難以復(fù)用,每一代產(chǎn)品軟件就像是從零開始?!绷私釨公司的馬超(化名)說:“另一方面,B公司沒有能真正掌控整個軟件棧的技術(shù)大牛。”
一位B公司的前員工透露,公司沒有業(yè)界頂尖的大牛,軟件團隊的人背景雖然都還不錯,但就背景差不多造成了相互看不上,怎么可能做出好產(chǎn)品。當(dāng)然,公司請過一個業(yè)內(nèi)某技術(shù)領(lǐng)域的高手,但面對AI芯片這么大一攤子軟件,估計也很難把控,待了一個多月兩個月就離開了。
對于這種情況,幾位業(yè)界人士有一些共識,這家公司的創(chuàng)始人確實是有深厚積累的芯片專家,但畢竟不是芯片架構(gòu)方面的專家,有局限性也很正常。但這家公司的創(chuàng)始團隊中沒有軟件的大牛,外部招來的人即便能力再強,也很難被“接納”,在核心管理團隊中沒有話語權(quán),也很難發(fā)揮合力做出好產(chǎn)品。
沒有高效、好用的軟件,也是B公司的投資人雖然購買了少量芯片測試,但沒能通過灰度測試,進入大規(guī)模采購環(huán)節(jié)的關(guān)鍵原因。當(dāng)然,B公司也拿到了政府項目,訂單金額不小,但實際能不能產(chǎn)生真實利潤都存疑,算不上高質(zhì)量、可復(fù)制的落地項目。
其實,目前國內(nèi)AI云端芯片公司大部分創(chuàng)始團隊都是有深厚的芯片從業(yè)背景,在對軟件的理解和重要性的認(rèn)知上有明顯的局限。
一位國內(nèi)AI芯片公司軟件的負(fù)責(zé)人直言:“CEO和CTO都聽不懂我的工作。一些國內(nèi)AI公司創(chuàng)始人對軟件的認(rèn)知,相比領(lǐng)先的國際大公司,我認(rèn)為有十幾年的差距。”
那么,AI芯片的軟件到底難在哪?
被AI軟件棧困擾的AI芯片公司負(fù)責(zé)人陳?。ɑ┲赋?,一方面,AI芯片的軟件是從零開始,具有天然的復(fù)雜性,與CPU不同,各家的AI芯片計算架構(gòu)和指令都不同,從編譯器到庫再到框架的適配,都不像CPU一樣有開源可以復(fù)用的東西。
另一方面,AI的軟件生態(tài)實際上就是英偉達生態(tài),但英偉達的軟件生態(tài),尤其是CUDA相關(guān)的核心部分都是閉源、封閉的,想要將自家的軟件與英偉達的生態(tài)兼容的難度可想而知,想要短期內(nèi)自己建立一個新的AI生態(tài),無異于癡人說夢。
最后,云端AI推理應(yīng)用的多變性。目前AI的算法和模型仍然在快速發(fā)展和迭代,好不容易實現(xiàn)了圖像分類ResNet 50模型的優(yōu)化,新的語言模型BERT模型又開始流行,自然語言處理模型又開始越變越大,BERT的各種變形枝繁葉茂,這也增加了AI芯片軟件的開發(fā)難度。
尤其是編譯器相關(guān)的開發(fā)難度,以及針對不同模型不依賴手工優(yōu)化,僅通過編譯器完成自動化性能優(yōu)化的模型泛化能力,這個能力的缺失幾乎成了大多數(shù)AI芯片停留在“送測”而不能獲取訂單的核心原因。
這些是所有英偉達的挑戰(zhàn)者面對的技術(shù)難題,同時還有人才的挑戰(zhàn)。
馬超和大多數(shù)AI芯片的從業(yè)者有相同的觀點,“要打造一個完整易用的AI軟件棧,必須要有一個不僅熟悉驅(qū)動、固件等基礎(chǔ)軟件,既能夠從上向下看,也要能從下往上看,對整個AI軟件生態(tài)有全面認(rèn)識,有足夠經(jīng)驗和能力的軟件大牛。”
“AI芯片火起來之前,在國內(nèi)做編譯器是個非常冷門的職業(yè)。”陳俊說:“編譯器是AI芯片軟件棧中重要的部分,國內(nèi)芯片相關(guān)軟件人才非常匱乏?!?/p>
手握入場券,敗倒在客戶「變態(tài)」的模型里
AI芯片創(chuàng)業(yè)公司軟件棧的問題并非無解,已經(jīng)在百度落地的昆侖芯,以及在字節(jié)跳動落地的希姆計算,是國內(nèi)為數(shù)不多被商業(yè)市場檢驗通過的AI芯片公司,摸索出了一條具備可復(fù)制性的商業(yè)化道路。
熟悉希姆計算的王雷(化名)說,“軟件都是和場景相關(guān)的,想要把軟件做好,只能接近客戶,深入業(yè)務(wù)。不僅要和客戶負(fù)責(zé)系統(tǒng)的人談,還要和運維、業(yè)務(wù)場景、算法的人深入溝通,否則很難把軟件做好?!?/p>
“想把軟件做好哪有捷徑可以走,國內(nèi)AI芯片公司都在一個起跑線上,也都有互聯(lián)網(wǎng)大廠的投資人,希姆計算能稍微跑的快一點,還是負(fù)責(zé)市場落地的人天天泡在客戶辦公室和工廠里磨出來的,但即便這樣,也不能保證未來的成功。”王雷認(rèn)為。
但AI芯片公司也不是輕輕松松就能獲得與客戶深入溝通的機會。一般的情況是,有需求的公司(比如BAT和移動運營商)會公開招標(biāo),AI芯片公司尋求合作,經(jīng)過初步篩選之后,符合需求的AI芯片公司可以送測產(chǎn)品,在現(xiàn)場運行客戶給的AI模型。
“很多公司連編譯那一關(guān)都過不去。”王雷說,“即便能編譯,不少公司聲稱算力是英偉達同級別產(chǎn)品的2倍,實際還不到其性能的1/4。”
張偉表示,“主要還是因為編譯器做的不夠好,通常都是依據(jù)芯片存算特征針對特定的模型手動做了優(yōu)化,不具備泛化能力。所以在遇到客戶特別‘變態(tài)’模型的時候,就會遇到困難,就算手動編譯通過,性能也會受限。比如一般情況下,96*96尺寸的圖片,可以順利編譯,吞吐性能還不錯,但客戶會根據(jù)自身業(yè)務(wù)需要對輸入的圖片尺寸進行調(diào)整,比如調(diào)整到1280*720,那性能就會受到大幅度影響,甚至編譯不通過。更有甚者,模型結(jié)構(gòu)都會發(fā)生諸如基礎(chǔ)算子和邏輯的變化,那編譯器的泛化能力是很難支撐直接跑起來的?!?/p>
這就是AI芯片編譯器的另一個難點所在,由于客戶的AI模型與其業(yè)務(wù)密切相關(guān),涉及商業(yè)機密,因此并不會直接把模型給芯片公司,AI芯片公司很難提前做有針對性的優(yōu)化。
但即便進展更快一點,昆侖芯也需要更多時間完善其軟件棧。張偉了解的情況是,昆侖芯的AI芯片在搜索場景對比英偉達的產(chǎn)品有一倍多的性能優(yōu)勢,但在其它場景優(yōu)勢很小甚至沒有優(yōu)勢。
“有聽到昆侖芯的客戶反饋離開了昆侖芯的人幫忙調(diào)試,芯片還是很難用起來?!标惪≌f,“軟件還是不夠好用,所有AI芯片公司都還需要時間去打磨,這需要一個過程。”
這對所有云端AI芯片公司而言都是一個需要花非常多時間和精力的工作,在落地的過程中可能需要為客戶開發(fā)數(shù)百項特性,這是在設(shè)計硬件和開發(fā)軟件棧之初都無法完全明確的需求,甚至都意識不到用戶會有哪些應(yīng)用場景和需求。
今年交卷,2024年開始淘汰
云端AI芯片公司們的落地競賽已經(jīng)開啟。馬超認(rèn)為,AI芯片公司今年下半年是給投資人和市場交答卷的時候了,今年如果還不能上量落地,可能今年底明年初就會有公司開始收縮。
陳俊認(rèn)為,云端推理AI芯片的格局明年會更加明朗。
王雷則認(rèn)為,即便是融資幾十億的AI芯片公司,按照千人規(guī)模,人均百萬的薪資計算,融資最多能撐到2024年,那時候就能看到真正裸泳的人。
想要在AI市場的競爭中不被淘汰,產(chǎn)品和選擇一樣重要。AI云端芯片公司們優(yōu)先把目光投向了采購規(guī)模在億美元級別頭部互聯(lián)網(wǎng)公司以及政府的項目。
張偉說:“政府的項目看起來需求很大,但實際比預(yù)想的需求小很多。”
“政府的項目看起來金額很大,芯片公司自己要承擔(dān)的成本也很高,實際上利潤不高。更重要的是,政府的AI項目不具備延續(xù)性和可復(fù)制性。”張超表示,“寒武紀(jì)近幾年每年都有政府項目簽單,如今的市值也不到300億,這足以說明資本的態(tài)度。”
“那些一個項目沒落地,估值快趕上寒武紀(jì)的公司,未來怎么持續(xù)發(fā)展?”多位AI芯片圈人士都質(zhì)疑。
因此,當(dāng)下檢驗一家云端AI芯片公司,無論是采用DSA(領(lǐng)域?qū)S眉軜?gòu))還是GPGPU架構(gòu),能在互聯(lián)網(wǎng)公司落地才是有硬實力的體現(xiàn)。
互聯(lián)網(wǎng)公司對于AI芯片有嚴(yán)苛的性能和穩(wěn)定性要求,能夠在互聯(lián)網(wǎng)公司的場景中落地,不僅證明了產(chǎn)品的可用性,也說明了其AI芯片落地的可復(fù)制性。
但也要看到,BAT的增長在放緩,AI算法的迭代速度也在變慢,AI芯片的前途雖然光明,但道路依舊曲折,特別是還有英偉達這個難以超越的領(lǐng)導(dǎo)者。
英偉達耗費十多年打造了以CUDA為基礎(chǔ)的AI生態(tài),有大量的合作伙伴共同優(yōu)化軟件和適配最新算法,有業(yè)內(nèi)頂尖的硬件團隊不斷迭代產(chǎn)品,客戶也早已習(xí)慣英偉達的軟件平臺。“我們怎么可能用幾年時間就趕超別人十幾年的成功?夢都不敢這么做?!边@是一位AI芯片創(chuàng)業(yè)公司CEO的心聲。
“差距和難度確實存在,但許多人都只是為了賺快錢,先把公司做大,不好好打磨產(chǎn)品,趕著商業(yè)化,然后盡快上市變現(xiàn),最后能留給中國半導(dǎo)體產(chǎn)業(yè)什么?”這是從業(yè)者留下的還沒有答案的問題。
云端AI芯片公司確實存在挑戰(zhàn),但相信一定會有跑出來的公司,如果想和作者更深度討論AI芯片的話題,可以添加作者微信BENSONEIT(注明來意),下一篇文章我們將講一講AI安防芯片的話題,歡迎從業(yè)者與作者討論。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。