0
本文作者: nebula | 2025-02-07 14:05 |
春節(jié)期間,DeepSeek 一躍成為全球矚目的焦點(diǎn)。它以僅約十分之一的超低訓(xùn)練成本,成功推出了性能與OpenAI o1近乎相當(dāng)?shù)拈_(kāi)源模型,對(duì)全球科技領(lǐng)域帶來(lái)巨大沖擊,先后引發(fā)美國(guó)科技股的大幅下跌,以及硅谷科技巨頭和各國(guó)政要的紛紛回應(yīng),如今全球各大芯片廠商和智算云服務(wù)廠商更是積極響應(yīng)、跟進(jìn)適配。半個(gè)月來(lái),DeepSeek相關(guān)話題熱度居高不下,熱搜頻頻,已成為全球科技、經(jīng)濟(jì)乃至政治領(lǐng)域的重要話題。
在全球人工智能技術(shù)競(jìng)爭(zhēng)日趨白熱化的當(dāng)下,中國(guó)科技企業(yè)正憑借獨(dú)特的創(chuàng)新路徑,深度參與這場(chǎng)意義深遠(yuǎn)的變革當(dāng)中。業(yè)界評(píng)論普遍認(rèn)為,DeepSeek的最大特點(diǎn)在于其作為開(kāi)源模型,通過(guò)在模型架構(gòu)、工程設(shè)計(jì)上的大量創(chuàng)新,實(shí)現(xiàn)了極致的效率提升,以更少的數(shù)據(jù)量和算力需求,達(dá)到了比肩全球領(lǐng)先閉源模型的性能表現(xiàn),大幅降低了業(yè)界的開(kāi)發(fā)成本和應(yīng)用門檻,甚至改變了全球人工智能的發(fā)展思路。
DeepSeek 的成功,也將更多優(yōu)秀的中國(guó) AI 企業(yè)推向世界舞臺(tái)的聚光燈下。近日,由麻省理工學(xué)院全資擁有的科技商業(yè)化智庫(kù)《麻省理工科技評(píng)論》(MIT Technology Review)刊發(fā)了一篇題為《關(guān)注DeepSeek之外的四家中國(guó)人工智能初創(chuàng)公司》的報(bào)道,指出階躍星辰(Stepfun)、面壁智能(ModelBest)、智譜AI(Zhipu)、無(wú)問(wèn)芯穹(Infinigence AI)四家企業(yè)同樣展現(xiàn)出不遜于DeepSeek的技術(shù)實(shí)力與全球競(jìng)爭(zhēng)力。
《麻省理工科技評(píng)論》于1899年在美國(guó)麻省理工學(xué)院創(chuàng)刊,是世界上最權(quán)威的科技商業(yè)媒體之一,也是世界上最古老的技術(shù)雜志及影響力最大的科技商業(yè)化智庫(kù)之一,其每年發(fā)布的 “十大突破性技術(shù)”榜單,更被視為全球科技發(fā)展的權(quán)威指南。
獲得《麻省理工科技評(píng)論》點(diǎn)名的這四家備受矚目的AI新銳中,首先是成立于2023 年4月,由前微軟高級(jí)副總裁姜大昕創(chuàng)立的階躍星辰。報(bào)道認(rèn)為,雖然階躍星辰起步相對(duì)較晚,但其憑借著一系列基礎(chǔ)模型的成功,迅速嶄露頭角。去年,階躍星辰已經(jīng)發(fā)布了11款基礎(chǔ)AI模型,涵蓋了語(yǔ)言、視覺(jué)、視頻、音頻以及多模態(tài)系統(tǒng)等多個(gè)領(lǐng)域,其大型語(yǔ)言模型Step-2參數(shù)超1萬(wàn)億,在第三方基準(zhǔn)測(cè)試網(wǎng)站LiveBench上,僅次于ChatGPT、DeepSeek、Claude和Gemini的模型。
面壁智能由清華大學(xué)知名研究團(tuán)隊(duì)于2022年共同創(chuàng)立。報(bào)道指出,面壁智能專注于效率提升,順應(yīng)端側(cè)模型發(fā)展趨勢(shì),推出了MiniCPM系列模型,被形象地稱為“小鋼炮”。該系列模型專為智能手機(jī)、個(gè)人電腦、汽車系統(tǒng)、智能家居設(shè)備乃至機(jī)器人等終端設(shè)備的實(shí)時(shí)處理設(shè)計(jì),其最新的MiniCPM 3.0 僅有40 億參數(shù),但在多個(gè)基準(zhǔn)測(cè)試中,性能與GPT-3.5不相上下;另一款模型MiniCPM-o 2.6,在平板電腦上實(shí)現(xiàn)了GPT-4o級(jí)別的效果。
同樣源于清華大學(xué)的智譜 AI,已發(fā)展成為一家與政府、學(xué)術(shù)界聯(lián)系緊密的企業(yè)。智譜AI既專注于基礎(chǔ)模型研發(fā),也基于模型開(kāi)發(fā)了對(duì)話模型ChatGLM和視頻生成工具清影(Ying)等一系列AI產(chǎn)品。其最先進(jìn)的大語(yǔ)言模型 GLM-4-Plus 通過(guò)高質(zhì)量合成數(shù)據(jù)訓(xùn)練,降低成本的同時(shí),還實(shí)現(xiàn)了與GPT-4相媲美的性能表現(xiàn);視覺(jué)模型 GLM-4V-Plus則在賦予AI更多“智能體”能力上邁出了重要一步。
同樣是清華系的初創(chuàng)企業(yè)無(wú)問(wèn)芯穹,雖然僅僅成立不滿兩年,但卻已經(jīng)吸引了近10億元(1.4億美元)的融資,并被譽(yù)為“中國(guó)CoreWeave”。報(bào)道指出,該公司專注于AI基礎(chǔ)設(shè)施領(lǐng)域而非模型開(kāi)發(fā),其核心競(jìng)爭(zhēng)力在于通過(guò)“多元異構(gòu)、軟硬協(xié)同”的核心技術(shù),打造連接“M種模型”和“N種芯片”的“MxN”AI基礎(chǔ)設(shè)施新范式,實(shí)現(xiàn)多種大模型算法在多元芯片上的高效協(xié)同部署,相當(dāng)于將來(lái)自不同品牌的芯片整合在一起形成“異構(gòu)計(jì)算集群”來(lái)執(zhí)行各類AI任務(wù)。無(wú)問(wèn)芯穹推出的Infini-AI異構(gòu)云平臺(tái)基于多元芯片算力底座,向大模型開(kāi)發(fā)者提供極致性價(jià)比的高性能算力和原生工具鏈,為大模型從開(kāi)發(fā)到部署的全生命流程降本增效,同時(shí)其大規(guī)模模型的異構(gòu)分布式混合訓(xùn)練系統(tǒng)HETHUB,可將AI模型訓(xùn)練時(shí)長(zhǎng)壓縮30%,進(jìn)而打造具有中國(guó)特色的高效解決方案。
從DeepSeek到四大新銳,中國(guó)AI企業(yè)正以獨(dú)特的發(fā)展路徑重塑全球AI的競(jìng)爭(zhēng)格局。憑借在原創(chuàng)技術(shù)和工程層面實(shí)現(xiàn)突破,進(jìn)而以更高的創(chuàng)新效率,快速追趕國(guó)際巨頭、構(gòu)建全新商業(yè)模式,乃至樹(shù)立全球人工智能發(fā)展新標(biāo)準(zhǔn),正是這些中國(guó)創(chuàng)新企業(yè)的共同特質(zhì)。隨著越來(lái)越多中國(guó)AI企業(yè)在全球舞臺(tái)上嶄露頭角,不僅將成為推動(dòng)中國(guó) AI 產(chǎn)業(yè)穩(wěn)健前行的關(guān)鍵力量,更將為全球AI發(fā)展貢獻(xiàn)更多中國(guó)智慧,引領(lǐng)人工智能產(chǎn)業(yè)邁向新的發(fā)展階段。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。