丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給洪雨欣
發(fā)送

0

斯坦福 AI 指數(shù)報告發(fā)布:2024年美國 AI 私人投資約為中國的 12 倍、GPT3.5 級別模型推理成本下降 280 倍

本文作者: 洪雨欣   2025-04-11 16:48
導語:權(quán)威報告數(shù)據(jù)顯示,中美 AI 差距進一步縮小。


4 月 7 日,斯坦福大學以人為本的人工智能研究所 (HAI) 發(fā)表了新的《2025年人工智能指數(shù)報告》,多項數(shù)據(jù)統(tǒng)計表明:中美 AI 的差距正在縮小,AI 技術的創(chuàng)新速度是過去十年的數(shù)倍之快。

該報告總篇幅接近 450 頁,主要亮點包括:

首先,報告指出,過去一年中美的 AI 投資都有了極大增長。其中,美國 AI 私人投資金額增長至 1091 億美元,幾乎是中國的 12 倍(93 億美元)與英國的 24 倍(45 億美元)。AIGC 創(chuàng)業(yè)的全球融資規(guī)模是 339 億美元,相比 2023 年增長了 18.7%。

其次,AI 模型正在變得肉眼可見地高效。在高效小模型的驅(qū)動下,GPT-3.5 級別的模型推理成本從 2022 年 11 月到 2024 年 10 月已經(jīng)下降 280 倍,硬件成本每年下降 30%。

同時,企業(yè)界在 AI 研究上明顯領先學術界。報告指出,2024 年幾乎 90% 的知名 AI 模型都是來自企業(yè)界,相比之下 2023 年是 60%。但盡管模型的參數(shù)規(guī)模在持續(xù)擴大,模型的性能差距卻在縮小:數(shù)據(jù)顯示,全球最頂尖的 AI 模型與排名第 10 的模型之間的性能差距在一年內(nèi)從 11.9% 縮小到了 5.4%。

此外,去年的指數(shù)報告重點指出了閉源與開源LLM之間顯著的性能差距,而在今年,這個差距被縮小至1.7%。

AI Infra 突飛猛進

報告統(tǒng)計顯示:每美元的人工智能性能已經(jīng)大幅提高。一個相當于GPT-3.5的人工智能模型的推理成本,從2022年11月的每百萬個token 20.00美元下降到2024年10月的僅每百萬個token 0.07美元(Gemini-1.5-Flash-8B),在大約1.5年的時間里減少了280多倍。

Epoch估計,固定性能級別的硬件成本每年下降30%,這使得人工智能訓練變得日益經(jīng)濟實惠、可擴展,并有助于模型改進。報告還稱,機器學習(ML)硬件的能效隨時間推移顯著提升,每年約提高40%。

根據(jù)Epoch AI數(shù)據(jù),2024年企業(yè)界貢獻了55個知名AI模型,而同年學術界未產(chǎn)生任何知名模型。值得注意的是,企業(yè)和學術合作產(chǎn)生的模型數(shù)量正持續(xù)增長。過去十年間,源自產(chǎn)業(yè)界的知名AI模型占比呈穩(wěn)定上升趨勢,至2024年已達到90.2%。

2024年,主要貢獻機構(gòu)為OpenAI(7個模型)、谷歌(6個)和阿里巴巴(4個)。自2014年以來,谷歌以186個知名模型位居榜首,其次是Meta(82個)和微軟(39個)。在學術機構(gòu)中,卡內(nèi)基梅隆大學(25個)、斯坦福大學(25個)和清華大學(22個)自2014年以來的模型產(chǎn)出量最為突出。

隨著模型參數(shù)量的增長,AI系統(tǒng)的訓練數(shù)據(jù)規(guī)模也同步擴大。Meta于2024年夏季推出的旗艦大語言模型Llama 3.3,訓練token量更是突破15萬億大關。

據(jù)Epoch AI研究顯示,大語言模型的訓練數(shù)據(jù)集規(guī)模約每8個月翻一番。這一指數(shù)級增長趨勢與模型復雜度的提升形成協(xié)同效應,持續(xù)推動AI性能邊界擴展。

Epoch估計,重要AI模型的訓練算力約每5個月翻倍一次,數(shù)據(jù)集每8個月翻倍,能耗每年增長,這一趨勢在過去五年尤為顯著。

OpenAI當前最先進的GPT-4o基礎模型,其訓練算力高達380億petaFLOP。

這種資源門檻使得學術界難以企及,導致企業(yè)界持續(xù)主導AI前沿研發(fā)。盡管今年差距略有收窄(去年AI指數(shù)報告首次指出該趨勢),但這一分化態(tài)勢仍在延續(xù)。

2024年12月推出DeepSeek V3模型引發(fā)了廣泛關注,其核心突破在于:在實現(xiàn)頂尖性能的同時,所需計算資源顯著低于多數(shù)主流大語言模型。下圖對比了中美兩國知名機器學習模型的訓練算力,揭示出一個關鍵趨勢:美國頂級AI模型的算力需求普遍遠超中國同類產(chǎn)品。

據(jù)Epoch AI數(shù)據(jù)顯示:

中國頭部語言模型的訓練算力增長自2021年底保持約3倍/年的增速

全球其他地區(qū)自2018年以來維持著5倍/年的增速水平

這一差距折射出兩國在AI研發(fā)路徑上的差異化選擇:中國團隊更注重算法效率優(yōu)化,而國際同行則傾向于通過算力堆砌推動性能突破。不過值得注意的是,DeepSeek V3的成功案例表明,計算效率的提升可能成為未來AI競賽的新賽道。

但是,AI指數(shù)的數(shù)據(jù)也驗證了近年來的行業(yè)猜測:模型訓練成本正呈現(xiàn)顯著上升趨勢。

2024年,少數(shù)可估算模型之一Llama 3.1-405B,訓練成本高達1.7億美元。訓練成本的高升主要為以下三點因素:

競爭加劇導致企業(yè)減少訓練過程披露,成本估算難度增加

訓練成本與計算需求呈直接正相關

計算需求越大的模型,其訓練成本呈幾何級數(shù)增長

各個大模型性能差距縮小

2024年1月初,領先的閉源模型性能超出頂級開源模型8.0%。至2025年2月,這一差距已縮小至1.7%。

這一快速進步主要得益于Meta在夏季發(fā)布的Llama 3.1,以及隨后推出的其他高性能開源模型,如DeepSeek的V3版本。

下圖展示了截至2025年1月Chatbot Arena排行榜前十名模型的概況。值得注意的是,2023年榜首模型與第十名模型的Elo技能評分差距為11.9%。而到2025年,這一差距已縮小至僅5.4%。

盡管思維鏈等推理機制的引入顯著提升了大語言模型(LLM)的性能表現(xiàn),但這類系統(tǒng)仍存在以下關鍵局限:

可靠性缺陷

無法穩(wěn)定解決可通過邏輯推理驗證正確性的問題(如算術運算、任務規(guī)劃等)

面對超出訓練數(shù)據(jù)規(guī)模的實例時表現(xiàn)尤為不佳

應用制約

嚴重影響系統(tǒng)的可信度評估

限制其在高風險場景(如金融決策、醫(yī)療診斷等)的應用可行性

OpenAI發(fā)布的o1模型在PlanBench測試中,對于需要至少20步解決的復雜實例,o1僅能完成23.6%。

規(guī)劃本質(zhì)上是組合優(yōu)化問題,解決長序列問題所需時間必然超過線性增長。這一特性解釋了當前模型在復雜規(guī)劃任務上的性能局限。

早期模型雖展現(xiàn)潛力,卻存在明顯缺陷:畫質(zhì)低下、缺乏音頻支持、視頻時長過短等(通常僅能生成2-4秒片段)。2024年,這一領域迎來重大突破——多家科技巨頭相繼發(fā)布新一代視頻生成系統(tǒng)。具體突破點如下:

視頻時長從秒級突破至20秒級

分辨率實現(xiàn)高清(HD)標準

生成內(nèi)容從2D拓展至3D領域

標志著文本-視頻生成技術進入實用化階段

2024年成為人形機器人發(fā)展的關鍵轉(zhuǎn)折點,具有類人形態(tài)和功能仿生的機器人實現(xiàn)多項突破。以Figure AI為代表的創(chuàng)新企業(yè)推出新一代通用人形機器人Figure 02,其技術特征包括復雜任務執(zhí)行、實現(xiàn)智能交互、支持"語音-推理-語音"閉環(huán)。

除AutoRT系統(tǒng)外,DeepMind同期發(fā)布了ALOHA(高級活動自主學習系統(tǒng))和DemoStart兩大創(chuàng)新平臺。其中ALOHA Unleashed版本在機器人精細操作領域?qū)崿F(xiàn)了重大突破,首次實現(xiàn)類人級精細動作控制,并證明了大模型+模仿學習的工程可行性。

大模型投資規(guī)模增長

2024年AI總投資額增至2523億美元,較2023年增長25.5%。過去十年間,人工智能相關投資規(guī)模增長了近13倍。

下圖展示了2013年至2024年全球企業(yè)人工智能投資的趨勢,涵蓋并購、少數(shù)股權(quán)、私募投資和公開募股。

2023至2024年間,全球AI領域私募投資增長44.5%,這是自2021年以來首次實現(xiàn)同比增長。

2024年生成式AI領域共吸引339億美元投資,較2023年增長18.7%,達到2022年投資規(guī)模的8.5倍以上。值得注意的是,2024年生成式AI投資占全部AI相關私募投資總額的比重已超過五分之一。

2024年獲得融資的AI企業(yè)數(shù)量躍升至2049家,較上年增長8.4%。其中,生成式AI領域的新獲投企業(yè)數(shù)量顯著增加——全年共有214家初創(chuàng)企業(yè)獲得融資,較2023年的179家和2019年的31家實現(xiàn)大幅提升。

2024年數(shù)據(jù)顯示,美國以1091億美元投資額高居榜首,中國(93億美元)位列第二,僅為美國投資額的8.5%,英國(45億美元)位列第三,投資規(guī)模相當于美國的4.1%。

2024年投資最集中的三大領域分別是:

AI基礎設施/研究/治理(373億美元)

數(shù)據(jù)管理與處理(166億美元)

醫(yī)療健康(110億美元)

其中,AI基礎設施、研究和治理領域的突出表現(xiàn),主要得益于OpenAI、Anthropic和xAI等專注AI應用開發(fā)的頭部企業(yè)獲得的大額投資。

麥肯錫最新報告顯示:

整體AI應用率從2023年的55%躍升至78%,78%受訪企業(yè)表示已在至少一個業(yè)務職能中應用AI技術。

生成式AI應用呈現(xiàn)爆發(fā)式增長:2024年應用率達71%,較去年(33%)增長超一倍。該技術作為去年新增調(diào)查項目,首次納入統(tǒng)計范圍。

企業(yè)應用AI已實現(xiàn)降本增收雙重效益,成本節(jié)約最顯著領域為:服務運營(49%受訪企業(yè)報告成效),供應鏈與庫存管理(43%),軟件工程(41%)。

最新的微軟職場研究表明:常規(guī)辦公任務中,文檔編輯效率提升10-13%,郵件處理時間縮短11%。專業(yè)崗位提升更顯著——安全分析師任務完成速度加快23%,準確率提高7%。

銷售團隊響應速度提升39%,同時轉(zhuǎn)化率提高25%。

在科研領域,材料發(fā)現(xiàn)速率提升44.1%,專利申請數(shù)量增長39.4%,產(chǎn)品原型產(chǎn)出增加17.2%。

這些數(shù)據(jù)印證了AI在提升工作質(zhì)量和效率方面的雙重價值。

AI For Science 依然存在極高天花板

2024年,AI驅(qū)動的研究斬獲最高榮譽——兩項諾貝爾獎授予了人工智能領域的突破性成就。

Google DeepMind的Demis Hassabis與John Jumper憑借AlphaFold在蛋白質(zhì)折疊領域的開創(chuàng)性工作獲獎。最新的AlphaFold 3已突破單一蛋白質(zhì)結(jié)構(gòu)預測,實現(xiàn)了對蛋白質(zhì)與關鍵生物分子(DNA、RNA、配體、抗體)相互作用的精準建模。

John Hopfield與Geoffrey Hinton因?qū)ι窠?jīng)網(wǎng)絡的基礎性貢獻獲物理獎。

AI 助力醫(yī)學、生物學研究。研究人員采用定向進化方法,證明大語言模型能夠生成在合成和實驗適應度景觀中均優(yōu)于傳統(tǒng)算法的蛋白質(zhì)序列。

生成式AI模型ProGen通過設計功能性蛋白質(zhì)序列,凸顯了AI輔助蛋白質(zhì)工程的潛力。同樣,基于Transformer的ProtT5等模型利用深度學習直接從序列數(shù)據(jù)預測蛋白質(zhì)功能與相互作用,推動了計算生物學發(fā)展。

公共數(shù)據(jù)庫的擴展對AI在蛋白質(zhì)科學中的應用至關重要,高質(zhì)量的大規(guī)模數(shù)據(jù)集使AI模型能基于多樣化的生物序列進行訓練,增強預測能力。2019年至今各公共蛋白質(zhì)科學數(shù)據(jù)庫的條目數(shù)量持續(xù)增長。然而,保障數(shù)據(jù)質(zhì)量與避免模型偏差仍是持續(xù)挑戰(zhàn)。

圖像與多模態(tài)AI也在推動科學發(fā)現(xiàn)。冷凍電鏡、高通量熒光顯微鏡與全玻片成像技術的進步,使科學家能高精度解析原子、亞細胞及組織層面的結(jié)構(gòu),揭示復雜生物過程的新機制。

隨著高通量顯微鏡技術的興起,視覺-語言模型及新興的視覺-組學基礎模型成為研究熱點。顯微鏡基礎模型數(shù)量隨技術發(fā)展持續(xù)增加:2024年光學顯微鏡模型從4個翻倍至8個。

2024年生物科學中AI驅(qū)動的蛋白質(zhì)研究中,功能預測(8.4%)居首,其次是結(jié)構(gòu)預測(7.6%)和蛋白質(zhì)-藥物相互作用(3.0%)。

面向生物任務的LLM智能體開發(fā)熱情提高。

隨著AI系統(tǒng)在科學領域(尤其是生物學)的應用價值日益凸顯,如何設計能夠調(diào)用工具解決復雜任務的智能語言模型成為關鍵挑戰(zhàn)。Aviary為此提供了一個結(jié)構(gòu)化框架,專門訓練語言智能體應對三大高難度科學任務:

DNA操作(用于分子克?。?/p>

科研問題解答(通過檢索科學文獻)

蛋白質(zhì)穩(wěn)定性工程

在Aviary環(huán)境中,基線模型Claude 3.5 Sonnet因無法訪問外部工具而表現(xiàn)受限,而集成到Aviary智能體框架中的模型在幾乎所有任務中均顯著優(yōu)于基線。

該研究揭示了兩大關鍵結(jié)論:

盡管通用LLMs在多數(shù)科學任務中表現(xiàn)良好,但結(jié)合領域?qū)<抑R對模型進行微調(diào)可進一步提升性能;

加速AI驅(qū)動的科研創(chuàng)新不僅依賴模型規(guī)模,更需通過外部工具交互實現(xiàn)能力拓展——這種「智能體化AI」正成為新范式。

對于模型所需token量,臨床LLM GatorTron(820億token)遠少于Llama 3(15萬億token),影像模型RadImageNet(1,600萬圖像等效token)僅為DALL-E(60億)的1/375。

此外,臨床場景AI應用潛力巨大。微軟與OpenAI團隊近期測試的o1模型以96.0%的準確率創(chuàng)下新紀錄(較2023年提升5.8個百分點)。

LLM臨床知識能力持續(xù)提升(尤其是配備實時推理的o1),但幻覺與多語言性能不一致問題仍存。

在診斷推理方面,使用GPT-4輔助的醫(yī)師診斷準確率(76%)僅略高于傳統(tǒng)工具組(74%);但GPT-4獨立診斷準確率達92%,較無AI輔助醫(yī)師提升16個百分點(圖5.4.6)。盡管AI獨立表現(xiàn)優(yōu)異,診斷時間未顯著縮短。后續(xù)需通過重構(gòu)工作流、用戶培訓與界面設計,才能將孤立模型優(yōu)勢轉(zhuǎn)化為臨床協(xié)同效能。

在過去的五年中,對醫(yī)學人工智能倫理問題的關注逐年增加。從2020年到2024年,與倫理和醫(yī)學人工智能相關的出版物數(shù)量增加了四倍。

公眾對 AI 時代更樂觀

2024年,67%的受訪者表示“對AI是什么有良好理解”,66%認為“AI將在不久的將來深刻改變他們的日常生活”。

認為AI驅(qū)動的產(chǎn)品和服務“利大于弊”的全球人口比例略有上升,從2022年的52%增至2024年的55%。

關于AI產(chǎn)品和服務的調(diào)查中,平均而言,中國受訪者對AI的認知度、信任度和熱情最最高。80%的受訪者表示“這些產(chǎn)品和服務讓他們感到興奮”。相比之下,僅58%的美國受訪者認為“AI將在未來3-5年深刻改變生活”。

過去一年中,“信任使用AI的企業(yè)會保護個人數(shù)據(jù)”的受訪者比例下降了3個百分點,“信任AI不會歧視或?qū)θ魏稳后w產(chǎn)生偏見”的比例下降了2個百分點。

不過輿論也存在顯著的地區(qū)差異。

亞洲和拉丁美洲的受訪者更傾向于認為AI利大于弊。相比之下,歐洲和英語國家的受訪者更為懷疑。僅46%的英國受訪者和39%的美國受訪者認為AI利大于弊。

今年的益普索調(diào)查新增了關于“AI如何影響當前工作”的問題。60%的受訪者認為“未來五年AI可能改變工作方式”,36%(超三分之一)認為“AI可能在未來五年取代現(xiàn)有工作”。

Z世代(67%)和千禧一代比X世代和嬰兒潮一代(49%)更傾向于認同“AI將改變工作方式”。2023至2024年,所有世代認同這一觀點的比例均上升,增幅最大的是千禧一代和嬰兒潮一代,可能表明代際間認知趨同。

雷峰網(wǎng)(公眾號:雷峰網(wǎng))


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

斯坦福 AI 指數(shù)報告發(fā)布:2024年美國 AI 私人投資約為中國的 12 倍、GPT3.5 級別模型推理成本下降 280 倍

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說