0
| 本文作者: 二維馬曉寧 | 2025-11-26 00:47 |
在2025年11月22日于深圳福田舉辦的IDEA大會上,IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋以一場視野宏闊、思考深邃的演講,為與會者勾勒出一幅人工智能與數(shù)字經(jīng)濟(jì)融合創(chuàng)新的未來圖景。
沈向洋以“創(chuàng)新曲線”理論開篇,系統(tǒng)梳理了IDEA研究院過去五年從基礎(chǔ)研究到規(guī)模落地的實(shí)踐路徑,并深刻指出,在ChatGPT掀起智能革命浪潮之后,全球正站在重新定義未來智能的關(guān)鍵節(jié)點(diǎn)。
以下是由雷峰網(wǎng)(公眾號:雷峰網(wǎng))審核發(fā)布的沈向洋演講全文實(shí)錄:
大家早上好!非常高興今天有機(jī)會在深圳福田歡迎大家來到2025 IDEA大會。我今天特別感慨,這幾年IDEA研究院在深圳不斷發(fā)展壯大,得到了很多領(lǐng)導(dǎo)的關(guān)心,也得到很多朋友的關(guān)注。開會前也見到不少老朋友。
今年想借這個機(jī)會梳理一下過去五年在IDEA研究院做過的一些工作。我們每年在11月22日舉辦IDEA大會,在深圳發(fā)布項(xiàng)目成果、實(shí)踐案例,系統(tǒng)地整理我們對于人工智能和數(shù)字經(jīng)濟(jì)的思考,并與大家交流。
IDEA有一條創(chuàng)新曲線,可以看到我們過去做的很多事情。我經(jīng)常用這條創(chuàng)新曲線來說明IDEA到底在做什么。創(chuàng)新有不同的維度,例如大學(xué)做基礎(chǔ)性創(chuàng)新、使命型創(chuàng)新,VC做風(fēng)險創(chuàng)新,但最后整個創(chuàng)新都要推到能夠大規(guī)模落地、與市場和社會發(fā)展緊密結(jié)合的階段。創(chuàng)新總是一步一步來的:從可能到可行、從可行到可用、再從可用到規(guī)模化。

真正大規(guī)模的創(chuàng)新,大部分資金是在工業(yè)界投入的。剛才(深圳市科技創(chuàng)新局局長)張林局長提到深圳95%的科創(chuàng)投入來自企業(yè)和產(chǎn)業(yè)界,而前面的創(chuàng)新同樣非常關(guān)鍵。IDEA研究院正處在創(chuàng)新曲線的甜區(qū)。
今天我們處在什么階段?接下來應(yīng)該往哪里走?特別是從2022年ChatGPT橫空出世以來,給所有人帶來巨大的沖擊,逼著我們重新思考當(dāng)下的智能以及未來的智能。
智能演進(jìn)的圖,各個機(jī)構(gòu)都畫過,雖然細(xì)節(jié)略有不同,但全球這么多團(tuán)隊(duì)在做探索,本質(zhì)上都是類似的路徑。

講AI總會說三大要素:算力、算法、數(shù)據(jù)。我今天想從這三點(diǎn)講起,再加兩點(diǎn):交互方式和載體。
第一個維度是算法架構(gòu)。算法和模型最典型的例子,是2017年谷歌發(fā)表的Transformer論文。當(dāng)時大家并沒有意識到這篇論文有多了不起,谷歌自己也沒有意識到。后來OpenAI做了預(yù)訓(xùn)練,推出GPT1、GPT2、GPT3,從那一刻開始世界被改變。最近一年里,2024年9月推出的o1讓大家意識到大模型推理能力的巨大提升,而DeepSeek改變了中國大模型的發(fā)展,也改變了世界大模型和開源大模型的發(fā)展方向。

未來的自主學(xué)習(xí)在哪里?我們該做什么?我有一些不成熟的想法。很多智能的底層邏輯不是新概念,我們應(yīng)該重新讀維納的《控制論》。真正的智能與控制論是徹底相連的,強(qiáng)化學(xué)習(xí)背后的數(shù)學(xué)也與我們學(xué)控制論時的最優(yōu)控制高度一致,這里面都有巨大的想象空間。
第二個維度是智能載體。最開始我們做的是模擬世界,語言模型從抽象到具體,從虛擬到物理不斷擴(kuò)展。做完語言模型,大家開始做多模態(tài),從聲音、圖像、視頻,甚至到4D。IDEA也做了很多多模態(tài)模型的工作,今天也會介紹。

最近大家常聽到“世界模型”。世界模型是在多模態(tài)基礎(chǔ)上向前推進(jìn),把物理規(guī)律融進(jìn)去,用模型來理解和探索真實(shí)世界。世界模型最終會進(jìn)入機(jī)器人、自動駕駛汽車、飛行器等具身載體。今天也會談具身智能。
從載體角度看,AI正在從理解世界,進(jìn)入真正改變世界的階段。
第三個維度是交互范式。過去七八十年,計算機(jī)科學(xué)的一個重要發(fā)展就是人機(jī)交互方式不斷進(jìn)化:從大型機(jī)命令行,到圖形界面,再到互聯(lián)網(wǎng)搜索,再到如今的推薦與自然交互。

在模擬世界階段,AI是被動的工具,類似早期的ChatGPT,問一句答一句,很像傳統(tǒng)搜索。但在探索世界階段,AI會變成持續(xù)的迭代循環(huán),會問、會回應(yīng),會像在幫你做研究一樣。
我們希望未來技術(shù)能強(qiáng)大到不只是回答問題,而是能像人類科研一樣一步步推進(jìn)。2018年我在微軟做WSDM主旨演講時講的主題就是“對話模型”。當(dāng)模型能歸納世界后,AI將會主動提問、主動執(zhí)行,再回到人類決策,確保行為不偏離正確軌道。
第四個維度是計算架構(gòu)。大模型發(fā)展讓大家最終都談到GPU、黃仁勛、NVIDIA。我常說黃仁勛每天醒來都在笑,因?yàn)槿澜缍荚诮o他送錢。GPU 2006年開始從游戲圖形渲染,變成通用并行計算的核心,也成為大模型崛起的重要基礎(chǔ)。

隨著智能進(jìn)入探索世界階段,我們需要的芯片不再只是訓(xùn)練芯片,而是更多推理芯片、端側(cè)芯片、強(qiáng)化學(xué)習(xí)專用芯片。這些應(yīng)用需求非常不同。例如強(qiáng)化學(xué)習(xí)芯片需要支持大量并行和快速交互;推理芯片需要極高能效和吞吐量。整體算力需求會繼續(xù)暴漲,而今日GPU能耗對電力系統(tǒng)的壓力已經(jīng)非常沉重。
未來有沒有超越馮·諾依曼體系的新架構(gòu)?最近量子計算有很多突破,也讓我們對于新架構(gòu)有新的想象。
第五個維度是數(shù)據(jù)。預(yù)訓(xùn)練時代之所以發(fā)展迅速是因?yàn)榛ヂ?lián)網(wǎng)把大量人類知識集中在網(wǎng)上,供模型使用。但到GPT3時代,互聯(lián)網(wǎng)數(shù)據(jù)已經(jīng)不夠用了?;ヂ?lián)網(wǎng)上真正清洗后可用的只有幾十TB,而且都是靜態(tài)的教材型數(shù)據(jù)。

但到了探索世界、強(qiáng)化學(xué)習(xí)階段,需要的是動態(tài)反饋數(shù)據(jù)。強(qiáng)化學(xué)習(xí)要“想法—決策—行動—反饋”完整鏈條,需要大量動態(tài)數(shù)據(jù)才能真正訓(xùn)練出探索能力。
靜態(tài)教材像看書,動態(tài)反饋像真正下場做事情。比如你不可能靠看書學(xué)會騎自行車。未來AI會越來越自主,必須能夠提出假設(shè)、收集證據(jù),才能提升智能。
數(shù)據(jù)和智能是互相推動的,沒有大數(shù)據(jù)就沒有大智能,沒有動態(tài)就沒有探索,沒有驗(yàn)證數(shù)據(jù)也無法走得更遠(yuǎn)。數(shù)據(jù)不是越大越好,質(zhì)量同樣關(guān)鍵。
沿著整個智能演進(jìn)路線圖,我主要想表達(dá)一個觀點(diǎn):在每一個階段都蘊(yùn)含巨大的創(chuàng)新機(jī)會。舉個小例子,就是數(shù)據(jù)。
IDEA最近有一個小團(tuán)隊(duì)孵化出一個公司,DataArc團(tuán)隊(duì),他們做的是合成數(shù)據(jù)。最早方向是解決小語種數(shù)據(jù)稀缺問題,比如阿拉伯語網(wǎng)上的語料只有4.5TB,不到英語語料的百分之一。訓(xùn)練阿拉伯語模型時存在大量缺口。
今天非常高興發(fā)布DataArc SynData開源框架,幫助做小語種業(yè)務(wù)的團(tuán)隊(duì)大幅提升效率。原來需要2000行代碼,現(xiàn)在只要50行。
他們在短短一年間,從兩篇論文開始,從數(shù)據(jù)路由、預(yù)訓(xùn)練數(shù)據(jù)合成,到推理、篩選、模型,全鏈路工作全部建立起來。也非常感謝深圳支持他們的投資機(jī)構(gòu),是IDEA孵化速度最快的團(tuán)隊(duì)之一。今天他們也在討論與中東公司的合作。
我是想借此表達(dá)一個觀點(diǎn):大家現(xiàn)在對AI焦慮很大,但AI有很多路徑可以走,每個國家、每個組織都應(yīng)該走屬于自己的發(fā)展路線。AI有兩個維度:攀登珠峰,做最大最強(qiáng)的模型;或者修建公路,讓更多人、更多場景能規(guī)?;褂肁I。這是兩條同樣重要的路線。

除了數(shù)據(jù),在模型層面也有巨大的創(chuàng)新機(jī)會。大家可能更關(guān)注超大模型,但在垂直場景里同樣有廣闊天地。郭健院長帶領(lǐng)團(tuán)隊(duì)在金融領(lǐng)域深耕:2021年推出全球最大金融行為知識圖譜,2022年Quant4.0,2023年AlphaGPT(投資智能體出現(xiàn)),2024年端到端金融預(yù)測模型。從數(shù)據(jù)提效到垂直場景的深度演進(jìn),都蘊(yùn)藏巨大機(jī)會。
接下來進(jìn)入第二部分:Agent。
Agent是模型落地的重要產(chǎn)品載體。比爾·蓋茨在2023年底預(yù)言,Agent不僅會改變?nèi)藱C(jī)交互方式,還會顛覆軟件行業(yè),將帶來自鍵入命令、點(diǎn)擊圖標(biāo)以來最大的計算革命。2025年是Agent創(chuàng)新爆發(fā)的一年,會在個體、公司、治理和創(chuàng)新等方面產(chǎn)生全面影響。
我們先看一個事實(shí):個體+AI現(xiàn)在已經(jīng)可以完成過去一個團(tuán)隊(duì)才能完成的工作。IDEA思維實(shí)驗(yàn)室一位設(shè)計師,為一家時尚品牌獨(dú)立完成一支廣告,從調(diào)研到策劃再到制作全流程,全部借助AI工具完成。這位同事入職前主要是做平面設(shè)計,并不是傳統(tǒng)意義的“視頻制作人”。
生產(chǎn)力決定生產(chǎn)關(guān)系。當(dāng)生產(chǎn)力發(fā)生幾十倍的躍遷,封裝在公司這種組織結(jié)構(gòu)下的生產(chǎn)關(guān)系必定發(fā)生根本變化。傳統(tǒng)公司里復(fù)雜任務(wù)要拆解給不同角色,用流程銜接,用考核保證質(zhì)量。前提是單個人能力有限,需要分工才能完成復(fù)雜任務(wù)。
但當(dāng)個體能力被AI放大10倍甚至100倍,很多原本需要多人協(xié)作的任務(wù)都能由一個超級個體端到端完成。企業(yè)的核心職能便不再是拆解任務(wù)、分配工作,而是如何成就這些超級個體,讓人與AI的深度協(xié)作釋放最大生產(chǎn)力。
組織重心將在部分領(lǐng)域從管理轉(zhuǎn)向“定義問題”和“融合超級個體”。有人開玩笑說CEO是Chief Entertaining Officer(首席氛圍官)。但在范式轉(zhuǎn)變下,真正的變化是認(rèn)知變化:超級個體不是天才的特權(quán),而是普通人的標(biāo)配。
過去我們都仰望超級個體,就像蒸汽機(jī)時代看到能操作機(jī)器的工人,或80年代看到會上網(wǎng)的人。到了2025年,會使用AI的超級個體會成為標(biāo)配。所以我們要問:我如何成為超級個體?超級個體會成為每一個人的未來。
從個體的未來,可以看到公司未來的變化。不論是AI時代新生的公司,還是成熟企業(yè)的AI升級,公司都會發(fā)生巨大重構(gòu)。IDEA的CTO工作室作為“產(chǎn)業(yè)場景中的頂尖技術(shù)容器”,正在推進(jìn)這方面的探索。
AI Agent在公司中的應(yīng)用非常豐富,可以把它們看作AI員工,融入現(xiàn)有的人類員工工作流。
在治理方面,政府和機(jī)構(gòu)同樣需要AI Agent。比如統(tǒng)計局,過去是人工找數(shù)據(jù)、整材料、寫報告。隨著數(shù)據(jù)庫和AI發(fā)展,很多工作可以自動化。去年我們發(fā)布經(jīng)濟(jì)超腦1.0,能理解數(shù)據(jù)和背后的邏輯。今年我們與南山區(qū)政府合作發(fā)布經(jīng)濟(jì)超腦2.0,實(shí)現(xiàn)從提問題、拆目標(biāo)、相關(guān)搜索、匯總到結(jié)論的完整流程。也歡迎更多政府機(jī)構(gòu)合作落地。
AI Agent給科研帶來的機(jī)會同樣巨大。AI for Science一直是我們重視的方向??茖W(xué)的每一次突破都來自新工具的誕生。有了工具,就有可能產(chǎn)生新的科學(xué)發(fā)現(xiàn)。
去年IDEA發(fā)布化學(xué)大模型,包括分子、抗體、反應(yīng)、藥物和文獻(xiàn)。今年有更大突破,我們的論文登上了《CELL》的子刊封面。今天發(fā)布新的藥物平臺Mozi,它既是AI智能體也是工具箱,可以真正緩解藥物早期研發(fā)中的誤導(dǎo)、黑箱和瓶頸。Mozi具備多智能體架構(gòu)、專家工具箱和自動化流程。
舉例來說,用Mozi設(shè)計帕金森病藥物:選靶點(diǎn)、生成分子、做篩選、安全過濾,最終能產(chǎn)出候選分子乃至完整報告。這么簡潔的輸入,就能產(chǎn)出多個接近臨床一期質(zhì)量的分子。
接下來介紹AI Agent在內(nèi)容生成上的應(yīng)用。AIGC內(nèi)容越來越多,但可控性才是關(guān)鍵。比如電影制作領(lǐng)域,如何做到生成內(nèi)容的自主可控?IDEA的一個團(tuán)隊(duì)研發(fā)了GPU渲染器SMARAY。這個項(xiàng)目和接下來要講的另一個Agent項(xiàng)目,都讓我很感慨。五年來在福田、深圳市政府和耐心資本的支持下,我們努力讓科研成果真正轉(zhuǎn)化為生產(chǎn)力。
大家熟悉IDEA的都知道MoonBit,這是張宏波團(tuán)隊(duì)做的AI時代編程語言。計算機(jī)歷史中每隔十幾年都會誕生一個主流語言,從C語言、Java、Python,到過去十幾年最重要的CUDA。AI時代的新語言正在被呼喚,AI編程也是確定會爆發(fā)的應(yīng)用方向。2025年大模型落地最愿意付費(fèi)的就是AI Coding。從OpenAI到谷歌、Gemini都在發(fā)力,國內(nèi)阿里、頭條也推出了系統(tǒng)。AI編程的影響堪稱對1500萬程序員行業(yè)的沖擊。
三年前我說服張宏波加入IDEA做AI編程。宏波是我所知唯一寫出被全球數(shù)萬人使用編程語言的中國人,他寫過ReScript。MoonBit由他帶隊(duì)開發(fā)。編程語言核心是開發(fā)者生態(tài),我們期待明年MoonBit開發(fā)者超過100萬,成為主流語言。

接下來,我想談具身智能和機(jī)器人。在深圳講具身智能意義尤其大。MIT Technology Review最近的封面特別有意思。以往機(jī)器人多在工廠里,而現(xiàn)在人形機(jī)器人不斷出現(xiàn)。那張封面很直白:未來“養(yǎng)兒防老”可能要靠機(jī)器人。但關(guān)鍵是:2025年在深圳怎么干?

我??碐artner的AI技術(shù)成熟度曲線。它把所有AI技術(shù)按階段分類。剛起步的有量子之類,持續(xù)向上的是具身智能,它還在上升期,機(jī)會非常多。頂端是最激動人心的技術(shù),2025年被稱為AI Agent元年。再往后,一些技術(shù)會慢慢冷卻,最后剩下真正有市場生命力的。

大家普遍相信,云服務(wù)、賣芯片這些肯定有商業(yè)價值。但我想強(qiáng)調(diào)的是:具身智能給我們帶來巨大機(jī)會。因?yàn)樗枰L期投入、系統(tǒng)協(xié)同、工程積累,而且技術(shù)棧復(fù)雜,包括編程語言等。
以機(jī)器人為例,具身智能不等于機(jī)器人,但機(jī)器人是最好例子。機(jī)器人像人:眼睛看、大腦算、手腳動。大灣區(qū)正是機(jī)電一體化和AI同時蓬勃的地方。黃仁勛去年在香港科技大學(xué)和我對談時就說,粵港澳大灣區(qū)在機(jī)電和AI的結(jié)合上非常像德國和日本,擁有巨大機(jī)會。

我們一定要抓住這個機(jī)會,做出真正偉大的成果。給大家看一個例子:萬物抓取。機(jī)器人要從二維感知到三維理解,并可靠抓取不同物體,這其實(shí)極難。長尾、小場景、多形態(tài),這是極高難度的問題。
具身智能最難的是“靈巧手”,難度堪稱“珠峰”。不是我們自己講難,馬斯克在做Optimus時,把人形機(jī)器人生產(chǎn)計劃縮小,他說機(jī)器人的手和前臂技術(shù)占了整個機(jī)器人難度的絕大部分。張建偉院士也在臺下,他肯定深有體會。

抓取難有很多原因:物體復(fù)雜、透明、軟體、變形、打扁的易拉罐等等。同時機(jī)械手本身還遠(yuǎn)遠(yuǎn)不夠,人類的手太強(qiáng)了,可以搬箱子,也可以穿針引線;可抓、可感、毫秒反饋。人手27個自由度,2.7萬個觸覺傳感器。手在進(jìn)化中讓人類獲得制造工具的能力。
我常說,現(xiàn)在大模型來了,人的大腦比不過AI;雙足機(jī)器人越來越強(qiáng),腿比不過AI。在AI面前,人類最后的尊嚴(yán)就是我們的“靈巧手”。不知道什么時候會被攻破,但如果要被攻破,我猜很可能會在深圳。

為什么這么說?今天上午大會開幕時的頒獎,是國內(nèi)首個聚焦機(jī)器人末端執(zhí)行賽的專業(yè)賽事,賽題是真實(shí)場景:選品、打包、干線運(yùn)輸、無人機(jī)、無人車再到最后末端配送。這個大賽將繼續(xù)由(國際先進(jìn)技術(shù)應(yīng)用推進(jìn)中心(深圳)主任)姚頌主任領(lǐng)導(dǎo)推進(jìn)。
具身智能方面,過去一年IDEA成立了三個新中心。
第一個是福田實(shí)驗(yàn)室,是我們與騰訊共同合作的實(shí)驗(yàn)室,推出國內(nèi)首個以模塊化方式提供大模型、開發(fā)工具和數(shù)據(jù)服務(wù)的具身智能軟件平臺Tairos。
第二個是國際先進(jìn)技術(shù)應(yīng)用推進(jìn)中心(深圳),會在具身智能方向和產(chǎn)業(yè)結(jié)合方面承擔(dān)更多工作,真正連接市場、產(chǎn)業(yè)、國內(nèi)外伙伴。
第三個是深港高等研究交流中心。IDEA發(fā)展五年,正進(jìn)入IDEA 2.0生態(tài)擴(kuò)張階段。MIT背景的鄭立中教授加入香港科技大學(xué)和IDEA,共同建設(shè)SHARE中心。深港合作是我們的重點(diǎn),希望香港大學(xué)、深圳大學(xué)、深圳企業(yè)共同做更大的事情。河套學(xué)院是一個很好的范例。
過去五年,IDEA研究院從幾個中心起步,在深圳市的大力支持下不斷擴(kuò)展,與合作伙伴一同成長。
IDEA大會最后一個環(huán)節(jié),總會介紹數(shù)字經(jīng)濟(jì)研究的重要方向——低空經(jīng)濟(jì)。今天最后二十分鐘,我和(IDEA研究院低空經(jīng)濟(jì)分院院長)李世鵬博士一起介紹我們在低空領(lǐng)域的最新思考,題目是《低空進(jìn)化路》。
低空經(jīng)濟(jì)的發(fā)展是技術(shù)、管理、經(jīng)濟(jì)的螺旋式上升,需要因地制宜地找到最適合落地的位置。雖然現(xiàn)在各地都在談低空,各城市都很激動,從國務(wù)院到地方都在推動,但真正能飛起來的仍有限。我們把低空經(jīng)濟(jì)分五步:萌芽期、驗(yàn)證期、成長期、成熟期、進(jìn)化期。
一個城市能飛多少架飛機(jī)、無人機(jī),是判斷的核心指標(biāo)。深圳算做得最好的,每天真正有經(jīng)濟(jì)價值的無人機(jī)飛行大約1000架,表演的不算,仍處于成長期。
推動低空進(jìn)化,要從可通達(dá)到可計算,再到可運(yùn)營,最終到可進(jìn)化。理解進(jìn)化過程非常關(guān)鍵。
在深圳,我們這些年做了很多努力,堅(jiān)持先行先試,從科技到產(chǎn)品,把低空經(jīng)濟(jì)一步一步往前推。過去十年出了四本白皮書,今年由李世鵬發(fā)布了第四本《白皮書4.0——通導(dǎo)監(jiān)網(wǎng)絡(luò)之路》。

這四本白皮書,是1.0到4.0的進(jìn)化。2022年我們介紹了什么是低空,提出《深圳方案》。2023年發(fā)布《全數(shù)字化方案》,把SILAS體系講清楚。2024年大家都很激動推動低空經(jīng)濟(jì)時,世鵬把安全體系提升到最高高度——只有安全飛行,低空經(jīng)濟(jì)才有機(jī)會做大。今年我們專注低空領(lǐng)域的核心技術(shù),構(gòu)建了自己的方法論,讓低空穩(wěn)步推進(jìn)。
這些年我們也走出一條自己的實(shí)踐路徑:探索、驗(yàn)證、推廣。通過白皮書與行業(yè)交流,也是我們整理出的深圳“中國方案”。
今年6月我在CVPR 2025做低空經(jīng)濟(jì)主旨演講,下個月在香港SIGGRAPH ASIA 2025會繼續(xù)介紹深圳的低空實(shí)踐。業(yè)內(nèi)越來越關(guān)注低空經(jīng)濟(jì),也在問:低空經(jīng)濟(jì)到底是什么?能帶來什么機(jī)會?如何改變生活和產(chǎn)業(yè)?
今天最后發(fā)布的是研究院的重磅作品——《低空時代》一書。過去一年,我與李世鵬、沈國斌、王丹薇共同完成,記錄團(tuán)隊(duì)從技術(shù)、產(chǎn)業(yè)到經(jīng)濟(jì)的跨學(xué)科思考,希望以這種方式與大家分享。

特別感謝這五年的探索,尤其是在低空經(jīng)濟(jì)方面,是深圳這座因改革而生、因創(chuàng)新而興的城市,給了我們包容和耐心支持。深圳正率先打開通向低空時代的新篇章。
今天以這本書的成果獻(xiàn)給低空經(jīng)濟(jì)的先行者,獻(xiàn)給改革開放四十周年的深圳,也獻(xiàn)給每一個即將踏入低空時代的你們。
謝謝大家!明年再見。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。