0
本文作者: 鄭佳美 | 2025-08-06 15:09 |
當(dāng) AI 大模型飛速進(jìn)化,最先被卷入洪流的,不是寫作畫畫或運(yùn)營(yíng),而是程序員。過(guò)去幾年,從 GitHub Copilot 開始,到 Cursor、Codeium、Claude Code,再到各類 Agent 框架如雨后春筍般涌現(xiàn),AI 開始進(jìn)入代碼世界,試圖不僅寫代碼、補(bǔ)代碼,更要理解工程、構(gòu)建系統(tǒng),乃至在沒(méi)有人的指令下完成一次次自動(dòng)迭代。
這場(chǎng)看似技術(shù)層面的革新,其實(shí)正在悄然重塑整個(gè)軟件開發(fā)范式,也讓“AI 是否將程序員作為第一個(gè)被顛覆的職業(yè)”成為一個(gè)日益無(wú)法回避的問(wèn)題。
然而,顛覆,從來(lái)不是一個(gè)單向度的詞。AI Coding 正在打開的是一條分叉的路徑:在存量程序員眼中,它是效率的躍遷工具,是寫代碼的新搭子;在非程序員眼中,它是一種“去編程化”的自由工具,是一種“用自然語(yǔ)言造軟件”的全新可能。而在真正理解軟件工程的人看來(lái),AI Coding 更像是剛剛起步的“工程幼兒園”:離真實(shí)的復(fù)雜協(xié)作、架構(gòu)設(shè)計(jì)、上下文演進(jìn)與嚴(yán)肅生產(chǎn)環(huán)境仍有巨大距離。
7 月 19 日上午,AI 科技評(píng)論組織了一場(chǎng)圍繞“AI Coding”的線上圓桌,請(qǐng)到了三位長(zhǎng)期深耕于 AI Coding 領(lǐng)域的代表人物:峰瑞資本的投資合伙人陳石、Auto Coder 創(chuàng)始人宿文與 ClackyAI 創(chuàng)始人李亞飛。他們的身份橫跨資本、模型與產(chǎn)品,也代表了對(duì)這個(gè)問(wèn)題的三種路徑觀察。
以下是此次討論的精彩分享,雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)) AI 科技評(píng)論進(jìn)行了不改原意的編輯整理:
AI 科技評(píng)論:歡迎大家來(lái)到今天的 GAIR Live 直播論壇。本場(chǎng)主題是 “AI 顛覆的第一個(gè)職業(yè)會(huì)是程序員嗎?”我們的第一次問(wèn)題:什么才叫 AI Coding?它與傳統(tǒng)軟件工程(SWE)有什么區(qū)別?AI 是否可能成長(zhǎng)為一種新的工程范式? 下面先請(qǐng)陳石來(lái)分享他的看法。
陳石:我理解的 AI Coding,如果從狹義角度來(lái)看,目前更多指的是AI 自動(dòng)生成或補(bǔ)全代碼,甚至是自動(dòng)完成整個(gè)代碼編寫過(guò)程。但這個(gè)“完成”往往并不符合真正的軟件工程范式,也很難滿足我們?cè)谲浖_發(fā)中常提到的一些規(guī)范性要求。
當(dāng)然,未來(lái)的 AI Coding 一定會(huì)朝著更工程化的方向演進(jìn)。它不僅要遵循現(xiàn)有的軟件工程規(guī)范,甚至可能會(huì)發(fā)展出一種全新的工程范式。這種范式不僅要求 AI 能寫代碼,還要求它能參與整個(gè)開發(fā)流程:從需求拆解、架構(gòu)規(guī)劃,到代碼生成、測(cè)試驗(yàn)證、持續(xù)集成部署(CICD),甚至包括多智能體協(xié)作、自我修復(fù)、持續(xù)迭代等關(guān)鍵環(huán)節(jié)。
所以,我認(rèn)為今天我們看到的 AI Coding,還處于非常早期的原型階段,只能在局部場(chǎng)景中解決一些簡(jiǎn)單問(wèn)題。但它的未來(lái)潛力不容低估——它會(huì)從生成“demo 級(jí)”的小程序,發(fā)展到真正具備構(gòu)建大規(guī)模、復(fù)雜系統(tǒng)能力的工具。這才是我眼中 AI Coding 的真正方向。
AI 科技評(píng)論:所以目前來(lái)看,AI Coding 還處在一個(gè)比較早期的階段,確實(shí)還無(wú)法真正達(dá)到軟件工程的標(biāo)準(zhǔn)。那接下來(lái)想請(qǐng)宿文老師談?wù)勀目捶ā?/p>
宿文:我們觀察到,今天 AI Coding 的產(chǎn)品形態(tài),基本可以分為兩大類,它們分別對(duì)應(yīng)兩類主要用戶。第一類是存量的程序員用戶。從最早的 GitHub Copilot,到后來(lái)的 Cursor、最近的Claude Code,這類工具主要圍繞開發(fā)者的 IDE 環(huán)境,提升代碼補(bǔ)全、協(xié)作效率等,甚至開始探索 SWE Agent 這樣的新范式。這個(gè)方向本質(zhì)上是面向已有開發(fā)者市場(chǎng)的,屬于一個(gè)存量場(chǎng)景,所以吸引了大量程序員的關(guān)注和使用。
第二類則是增量用戶,主要面向非程序員群體。他們率先服務(wù)的還是posumer,這些人可能不會(huì)寫代碼,但有明確的軟件或應(yīng)用需求,有點(diǎn)像產(chǎn)品經(jīng)理,但是是“打著引號(hào)的產(chǎn)品經(jīng)理”——他們可以用自然語(yǔ)言描述自己的需求,并期望 AI 幫助把這些想法變成一個(gè)原型產(chǎn)品。
目前,AI 模型在前端 UI 生成方面已經(jīng)比較成熟,但真正的軟件工程深水區(qū),比如后端邏輯、數(shù)據(jù)庫(kù)設(shè)計(jì)、高并發(fā)、高可靠性的處理能力等更難的技術(shù)棧,還遠(yuǎn)遠(yuǎn)沒(méi)有突破。這正是接下來(lái)整個(gè)技術(shù)體系要努力的方向。
所以我們認(rèn)為,AI Coding 一方面是在提升存量程序員的效率,另一方面也在拓展增量市場(chǎng)、實(shí)現(xiàn)開發(fā)能力的“平權(quán)”。最終的目標(biāo),是讓更多人即使不具備編程能力,也能自由地實(shí)現(xiàn)自己的軟件想法,而不再受限于“程序員供給”的門檻。
AI 科技評(píng)論:聽(tīng)起來(lái)這是兩個(gè)方向——一個(gè)面向程序員的效率提升,一個(gè)面向非程序員的能力擴(kuò)展,確實(shí)可以看作是兩條路徑。那接下來(lái)也想請(qǐng)李亞飛老師來(lái)聊一聊,特別是 ClackyAI 最近剛發(fā)布了新產(chǎn)品,我們也很期待聽(tīng)聽(tīng)你的觀察和看法。
李亞飛:好的,剛才大家聊到了 AI Coding 的定義,我也想從兩個(gè)角度補(bǔ)充一下我的理解。第一,是從軟件工程的復(fù)雜度維度來(lái)劃分。我們可以把軟件項(xiàng)目按照工程復(fù)雜程度分成五個(gè)等級(jí),從 C1 到 C5:
C1:最簡(jiǎn)單的項(xiàng)目,比如通過(guò) GPT 聊天生成一個(gè)前端頁(yè)面、小工具、小游戲,通常只有一個(gè)文件,純前端邏輯即可。
C2:稍微復(fù)雜一些的小工程,可能包含 10 個(gè)文件以內(nèi),具備基本樣式和簡(jiǎn)單邏輯,比如帶 UI 的小網(wǎng)頁(yè)。
C3:像公司官網(wǎng)這樣的項(xiàng)目,結(jié)構(gòu)更完整,文件量可能在 100 個(gè)以內(nèi),涵蓋完整的前端和部分簡(jiǎn)單交互。
C4:真正意義上的軟件工程,具備前端、后端、數(shù)據(jù)庫(kù),業(yè)務(wù)邏輯相對(duì)復(fù)雜,通常涉及多個(gè)模塊的協(xié)同。
C5:超級(jí)大工程,比如 Linux、Windows 這類操作系統(tǒng)級(jí)項(xiàng)目,涉及百萬(wàn)文件、成千上萬(wàn)名開發(fā)者協(xié)作。
目前我們看到的 AI Coding,大多還停留在 C1 到 C3 的階段。也就是說(shuō),它能勝任原型開發(fā)、小工具生成,但距離嚴(yán)肅軟件工程(C4以上)還有一段路要走。
第二個(gè)維度,是 AI Coding 對(duì)人類價(jià)值的進(jìn)化階段。我們可以理解為 AI Coding 本身也在經(jīng)歷從「工具」到「合作者」的過(guò)程:
第一階段是“輔助補(bǔ)全”階段,AI 能補(bǔ)全代碼、預(yù)測(cè)你接下來(lái)可能寫的內(nèi)容,就像文章寫作里的自動(dòng)續(xù)寫功能,這一階段已經(jīng)發(fā)展了近兩年。
第二階段是“AI 原生編程”,像 Cursor 這樣的產(chǎn)品代表,基于聊天輔助的編程工具。AI 能圍繞用戶的需求實(shí)現(xiàn)具體模塊、功能,好的就留下來(lái),不好的就可以丟掉。開發(fā)者還是主駕駛員,但 AI 已能提供有價(jià)值的思路和建議,
第三階段是我們現(xiàn)在正進(jìn)入的 “Agentic” 階段,AI agent作為一個(gè)“AI工程師”真正參與到從 0 到 1 的項(xiàng)目建設(shè)中。我們一年前就開始做了,但真正能落地還是在最近一個(gè)月。這是以Claude Code為代表的新型的軟件開發(fā)模式,這種體驗(yàn)非常獨(dú)特:你告訴它一個(gè)目標(biāo),它會(huì)在后臺(tái)持續(xù)“工作”,幾個(gè)小時(shí)后告訴你“已經(jīng)搞定了”。你去檢查時(shí)會(huì)發(fā)現(xiàn),大約七成已經(jīng)搭好了,剩下三成搞差了。這個(gè)過(guò)程既矛盾又開心。
這一階段,我們認(rèn)為才是真正的 AI 工程師時(shí)代的起點(diǎn)。
AI 科技評(píng)論:有人跟我說(shuō),你在舊金山的一個(gè) zip code下面,你能找出來(lái) 20 家 AI Coding 的公司,而且每一家切入點(diǎn)都不太一樣,有做 code review,有做 document 的,各種都有,那這個(gè)賽道它有沒(méi)有機(jī)會(huì)收斂?很多不同種類的公司的同時(shí)并存,是不是一個(gè)很長(zhǎng)期的事情?
李亞飛:我簡(jiǎn)單說(shuō)一下我看到的一些現(xiàn)象。現(xiàn)在中國(guó)這邊其實(shí)還沒(méi)那么“熱”,大家應(yīng)該也能感受到,雖然也有一些公司在做,但整體氛圍相對(duì)克制。反倒是美國(guó)那邊、尤其是硅谷,非?;钴S,因?yàn)槟沁吺擒浖奶焯寐铩?/p>
但也因?yàn)檐浖こ痰膹?fù)雜度很高,它早就形成了非常明確的分工體系。在今天 AI 還處于相對(duì)早期階段的情況下,其實(shí)每個(gè)工種理論上都能被賦能。這也是為什么你會(huì)看到市面上有那么多 AI Coding 公司:做 code review 的、做測(cè)試的、做需求管理的……整個(gè)軟件開發(fā)流程每個(gè)環(huán)節(jié)都能開出一家公司來(lái)。
人類工程師掌握不了那么多的知識(shí)密度,所以需要分工,現(xiàn)在的AI可能在某個(gè)方向不是超級(jí)專家,但是它在大多數(shù)方面都是個(gè)中級(jí)工程師,這個(gè)時(shí)候分工就要發(fā)生變化了。
我覺(jué)得現(xiàn)在的趨勢(shì)就是從多 Agent 走向單 Agent 架構(gòu)。因?yàn)榉止?lái)的成本太高,反而不如一個(gè)大模型“一人多能”來(lái)得劃算。有些場(chǎng)景可能不存在了,比如code review 這個(gè)環(huán)節(jié),都是AI寫的,你還 review 啥?你是在為人類寫代碼做AI,還是在為“AI時(shí)代新的軟件工程”做AI? 這里面有本質(zhì)的變化和區(qū)別?,F(xiàn)在大家看得也都不太清楚,所以這么多公司百花齊放,大家沖進(jìn)去先干,活下來(lái)再說(shuō)。這是我目前的觀察。
AI 科技評(píng)論:那你覺(jué)得,接下來(lái)這些基于分工誕生的 AI Coding 公司,會(huì)不會(huì)隨著分工變少、被逐漸取代?未來(lái)是不是就不再需要這么多細(xì)分方向了?
李亞飛:可能開始有很多山頭,然后會(huì)進(jìn)入收斂階段,我不覺(jué)得會(huì)完全一家獨(dú)大——因?yàn)檐浖こ烫珡?fù)雜了,不太可能被某一個(gè)玩家完全吃掉。更現(xiàn)實(shí)的情況是,會(huì)在幾個(gè)方向、幾個(gè)垂類場(chǎng)景里,各自形成一些穩(wěn)定陣地。這個(gè)行業(yè)用戶的付費(fèi)能力和意愿都很強(qiáng),市場(chǎng)空間也足夠大,所以哪怕到終局,也不會(huì)是一個(gè)標(biāo)準(zhǔn)答案。
AI 科技評(píng)論:那陳石老師你從投資人的視角怎么看?
陳石:為什么美國(guó)有這么多切入點(diǎn)不一樣的公司?我覺(jué)得 AI Coding 是當(dāng)前 AI 應(yīng)用落地中最有機(jī)會(huì)的幾個(gè)方向之一。所謂“最有機(jī)會(huì)”,我覺(jué)得可以從三個(gè)維度來(lái)看:第一,用戶規(guī)模足夠大;第二,模型能力已經(jīng)接近可用水平,至少達(dá)到了能滿足基本使用的程度;第三,市場(chǎng)上已經(jīng)有一部分產(chǎn)品找到了初步的 PMF,比如 Cursor,好像現(xiàn)在已經(jīng)能做到年化 5 億美金的營(yíng)收了。這三點(diǎn)決定了為什么這個(gè)賽道這么熱、公司這么多。
但與此同時(shí),我們也看到這個(gè)行業(yè)沒(méi)有明顯的收斂趨勢(shì),原因在于很多關(guān)鍵問(wèn)題還沒(méi)有達(dá)成共識(shí),這一點(diǎn)作為一個(gè)天天見(jiàn)項(xiàng)目的投資人,我感受非常深。
首先是 Copilot 還是 Agent ?未來(lái)我傾向于認(rèn)為 Agent 會(huì)更有潛力,但也一定會(huì)存在大量 Copilot 的場(chǎng)景,畢竟熟練的程序員很多時(shí)候還是更喜歡“手搓”。我們?cè)居X(jué)得 Copilot 不太適合創(chuàng)業(yè)公司,但 Cursor 的出現(xiàn)又讓這個(gè)觀點(diǎn)變得不那么確定了。
還有一個(gè)懸而未決的問(wèn)題是:模型能力的邊界到底在哪? 現(xiàn)在看,模型在處理一些垂直方向,比如單元測(cè)試、Code Review 這類任務(wù)上表現(xiàn)還不錯(cuò),端到端地做簡(jiǎn)單或中等復(fù)雜度的程序時(shí)也能勝任,但面對(duì)真正復(fù)雜的軟件系統(tǒng)、長(zhǎng)鏈條的邏輯結(jié)構(gòu)時(shí)還是不行。
同時(shí)還有個(gè)現(xiàn)實(shí)問(wèn)題是:模型廠商的業(yè)務(wù)邊界在哪里? 有些創(chuàng)業(yè)公司會(huì)選擇做 Agent,但他們會(huì)有意避開模型公司可能會(huì)直接做的端到端方案,轉(zhuǎn)向更具壁壘的垂直場(chǎng)景。
Vibe Coding的市場(chǎng)有多大?很多人其實(shí)邏輯思考能力并不強(qiáng),沒(méi)有能力把自己的需求有效地表達(dá)出來(lái),所以這里頭有很多不太確定的東西。
我認(rèn)為, code review 或者單元測(cè)試這些 AI Coding的機(jī)會(huì)不太大,因?yàn)樾枨蠛彤a(chǎn)品定義得很清楚了,產(chǎn)品規(guī)范上沒(méi)有門檻了。未來(lái)的Coding應(yīng)該是每一個(gè)軟件都是定制化的軟件,有機(jī)會(huì)的應(yīng)該是能圍繞垂直行業(yè)和 “深度上下文”展開的Agent,這是模型公司做不了的事情。圍繞著這些垂類行業(yè)的深度上下文,做大量的加工,總結(jié)成良好的提示詞和上下文工程,跟模型做交互,這才是我們創(chuàng)業(yè)公司比較好的發(fā)展機(jī)會(huì)。
AI 科技評(píng)論:宿文老師,您說(shuō)您希望做一些“用完即焚”的軟件。我覺(jué)得這個(gè)思路和剛才陳石老師提到的“定制化軟件”某種程度上是相通的,所以也想請(qǐng)您展開聊聊這個(gè)想法,背后有哪些考慮?
宿文:其實(shí)這個(gè)是我們公司的一個(gè) slogan,上半場(chǎng)是 Auto-coding is AGI,下半場(chǎng)是 Personal App is the End。意思是說(shuō),以后每個(gè)人都有屬于自己的 Personal App。這個(gè)APP可以是長(zhǎng)期消費(fèi)的,也可以是一次性的軟件。
我們可以先預(yù)測(cè)一下終局,如果所有的Coding都是依賴于token去完成的,那可能就會(huì)發(fā)展為模型廠商贏者通吃的局面。走向未來(lái)的過(guò)程中,其實(shí)每一輪新的工具或技術(shù)出現(xiàn),首先都是在現(xiàn)有的存量市場(chǎng)中扎根的。畢竟這么多專業(yè)的人才、聰明的大腦,一定會(huì)嘗試擁抱它,把它應(yīng)用到已有的工作場(chǎng)景中。畢竟我們看到整個(gè)軟件世界體量非常龐大,從芯片往上一層一層搭建上來(lái),最終都匯聚在“軟件”這個(gè)抽象層。
有些語(yǔ)料是大模型在后訓(xùn)練(Post-train)或者預(yù)訓(xùn)練(Pre-train)階段見(jiàn)不到的,都是這些垂直領(lǐng)域的玩家在用自己的知識(shí)去做的。這里面的卡點(diǎn)就是,今天的模型應(yīng)該怎么去支持他們?模型架構(gòu)在往前迭代,現(xiàn)在主流模型支持的上下文大概在 120K token 左右,往上做到幾百 K 的已經(jīng)是極限了,Gemini做到Mb級(jí)別的長(zhǎng)度了。
我們自己就是從模型層開始干的,我們就發(fā)現(xiàn)很多問(wèn)題,只要模型迭代下個(gè)月就沒(méi)有了,開發(fā)者只要去擁抱新的技術(shù)生態(tài)就好了。
所以對(duì)我們來(lái)說(shuō),在這個(gè)不斷變化的過(guò)程中,最關(guān)鍵的是找到一個(gè)落點(diǎn)——我們會(huì)去尋找那些不容易被“堆人”、“堆資源”就能打下來(lái)的場(chǎng)景。很多產(chǎn)品和場(chǎng)景,可能按月、按季度就會(huì)被迭代掉。我們思考的也是,既要看清一個(gè)遠(yuǎn)處的終局,也要找到當(dāng)下能活下去的路徑,所以我們也考慮向 C4 這個(gè)環(huán)節(jié)去突破,面向嚴(yán)肅的生產(chǎn)環(huán)境制作軟件。
李亞飛:我想補(bǔ)充問(wèn)一個(gè)問(wèn)題,想請(qǐng)教一下宿文。其實(shí)剛才提到的 C4 工程——也就是涉及前端、后端、數(shù)據(jù)庫(kù)這些完整鏈路的軟件開發(fā)——它其實(shí)是可以有很多不同的解法的,對(duì)吧?比如說(shuō),有些人會(huì)選擇無(wú)代碼、低代碼的方式來(lái)處理,也有一些人堅(jiān)持用標(biāo)準(zhǔn)的技術(shù)棧、按照傳統(tǒng)軟件工程方法來(lái)推進(jìn)。那我挺好奇的是,你們?cè)谶@方面是怎么思考和選擇的?你們更傾向于哪種路徑?
宿文:你肯定觀察到了最近的一些新聞,包括最近被Wix收購(gòu)的Base44,這個(gè)產(chǎn)品是挺好用的,但是典型地用到了低代碼的手段,很親和于Wix的建站場(chǎng)景,整個(gè)軟件世界肯定不止這些。我們自己的判斷是,原有那套軟件開發(fā)架構(gòu)還是局限于場(chǎng)景之中,是為“人”設(shè)計(jì)的,尤其是為架構(gòu)師、程序員設(shè)計(jì)的,它的核心是:鏈條越長(zhǎng)、分工越細(xì),就越能發(fā)揮規(guī)模協(xié)作的優(yōu)勢(shì)。比如一個(gè)大廠有幾千上萬(wàn)程序員,每個(gè)人都是一個(gè)“螺絲釘”,整個(gè)鏈條組織得非常高效。但大模型來(lái)了之后,它的理解和處理方式完全不是這么玩的,我們?cè)谧鋈珬n惿傻臅r(shí)候就非常明顯地感受到這點(diǎn)。
所以我們現(xiàn)在的重點(diǎn)方向是,探索一種面向語(yǔ)言模型親和、以生成為核心的軟件 agent 架構(gòu)。我們認(rèn)為這兩條路徑缺一不可。怎么去理解面向模型的生成式軟件架構(gòu),這是我們要去摸索的。舉例而言,在面向B端的應(yīng)用中,每個(gè)頁(yè)面都會(huì)有一個(gè)搜索組件,但是在生成式的軟件中,整個(gè)架構(gòu)中只有一套搜索的組件,我們?cè)偃ミx擇如何適配各種場(chǎng)景。
我們現(xiàn)在的看到的,比如 Devin 這套架構(gòu)里面,它本質(zhì)上是要替代程序員的,但是又按照程序員的分工協(xié)作去做的技術(shù)鏈條的設(shè)計(jì),我覺(jué)得這樣很怪。我們?cè)趪L試一條新的道路。
李亞飛:明白,這個(gè)問(wèn)題其實(shí)我們作為創(chuàng)業(yè)者,真的會(huì)有很深的感受。它本質(zhì)上是一種“內(nèi)心的矛盾狀態(tài)”。這個(gè)矛盾來(lái)自兩個(gè)方向:一方面,我們知道市場(chǎng)、尤其是投資人這邊,確實(shí)會(huì)有壓力,大家都希望你能盡快跑出 PMF,最好能快速閉環(huán),用戶開始付費(fèi),模型也能用起來(lái)。
那么從戰(zhàn)術(shù)上講,其實(shí)是有一些作弊的方法的。比如說(shuō)我就只做個(gè)純前端界面,模型生成完一閉環(huán),看起來(lái)像個(gè)產(chǎn)品,就能收錢了;又比如說(shuō)我提前把整個(gè)技術(shù)棧鎖定,用低代碼的方式、圍繞某套提示詞和上下文優(yōu)化打磨,也是可以很快搞出東西的。這些辦法都能跑得快、看起來(lái)也“成型”了。
但另一方面,作為搞了十多年全棧開發(fā)的工程師,我們心里也非常清楚——這些方式不是終局,甚至說(shuō)是“偏離正確道路”的妥協(xié)。它們讓團(tuán)隊(duì)進(jìn)入了一個(gè)短暫的“舒適區(qū)”,但那個(gè)方向很可能不是 AI Coding 的未來(lái)。所以這時(shí)候你就會(huì)非常矛盾。
到底是堅(jiān)持正確的選擇,還是馬上進(jìn)入快車道去做閉環(huán),有時(shí)候會(huì)讓團(tuán)隊(duì)陷入一種無(wú)所適從的狀態(tài)。剛才聽(tīng)宿文的回答,我覺(jué)得他其實(shí)在那套路徑里,也體現(xiàn)出了一種對(duì)這類矛盾的平衡。這個(gè)我挺有共鳴的。
陳石:我這邊想補(bǔ)充一句,其實(shí)亞飛老師剛才說(shuō)的那種“矛盾”,確實(shí)在市場(chǎng)上是存在的,甚至可以說(shuō)是目前不少創(chuàng)業(yè)者都會(huì)面對(duì)的現(xiàn)實(shí)困境。
就比如現(xiàn)在大家經(jīng)常討論的一個(gè)路徑問(wèn)題:是不是應(yīng)該先從 Copilot 做起,有了局部的數(shù)據(jù)和經(jīng)驗(yàn),再泛化到 Agent?但自動(dòng)駕駛行業(yè)又有不同說(shuō)法,例如有些專業(yè)人士認(rèn)為,L2做得越好,就距離L4越遠(yuǎn)(當(dāng)然很多業(yè)界人士包括我自己并不完全認(rèn)同這個(gè)觀點(diǎn))。這也引申到 AI Coding 的問(wèn)題上——你是先專注于一個(gè)垂直場(chǎng)景,做得足夠深,然后再圖泛化?還是說(shuō)一開始就奔著通用方向去?這兩種路線還沒(méi)有形成什么共識(shí),現(xiàn)在還處于一個(gè)多種探索并存的階段。
李亞飛:今天 Cursor 上個(gè)月改了收費(fèi)方式之后,就被用戶打回原形了,就是這個(gè)矛盾的體現(xiàn)。就是作為 Copilot 產(chǎn)品,現(xiàn)在想按 agent 產(chǎn)品收費(fèi),用戶不 buy in。這就是一個(gè)矛盾。但如果你第一天就是做的 agent,那你就按這個(gè)方式,比如按任務(wù)規(guī)模復(fù)雜度來(lái)收費(fèi),那就可以了。
陳石:我覺(jué)得Cursor的經(jīng)濟(jì)模型可能做不過(guò)來(lái)了。
李亞飛:我同意。我補(bǔ)充一個(gè)使用體驗(yàn)上的角度。Cursor原來(lái)的收費(fèi)方式是,一個(gè)月內(nèi)500次調(diào)用收費(fèi)20美金。這是基于上個(gè)階段的Chat-Base program的產(chǎn)品結(jié)構(gòu)所定義的收費(fèi)方式。但是 Agent 的工作方式是,給它一個(gè)目標(biāo),它能自己循環(huán)500次。結(jié)果 Agent 花了500次的錢,只收了用戶1次的錢,那Cursor肯定想改。這就是 Agent 模式和 Copilot 模式打架的問(wèn)題。
AI 科技評(píng)論 :去年一整年,隨著Claude 3.5、3.7的發(fā)布,AI 編程已經(jīng)變得越來(lái)越“實(shí)用”了,甚至開始推動(dòng)整個(gè)交互范式往 Agent 模式轉(zhuǎn)變。那問(wèn)題來(lái)了——作為投資人,以及親自參與模型開發(fā)和基于模型做產(chǎn)品的人,你們?cè)趺纯串?dāng)前模型能力的瓶頸?
宿文:其實(shí)從我們自己的觀察來(lái)看,整個(gè)大模型的能力還遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到理想狀態(tài),離我們想象中那個(gè)“終點(diǎn)”還差得挺遠(yuǎn)的。但是我們也不能等下一個(gè)版本出現(xiàn),因?yàn)檎f(shuō)實(shí)話,你等再久,它也不會(huì)主動(dòng)把你的用戶數(shù)據(jù)納入到 Pre-train 里,所以我們不應(yīng)該做技術(shù)等待型的公司。
Claude 3.5出來(lái),伴隨著一個(gè)很有意思的產(chǎn)品,Artifacts,我們今天就看到了 lovable 這種首先找到一個(gè)變現(xiàn)場(chǎng)景的產(chǎn)品,不管爭(zhēng)議多大,用戶量都有了,前端也能寫的很好。其實(shí)前端語(yǔ)言的邏輯性是很弱的,很多前端代碼都暴露在公網(wǎng),所以這些都能做出來(lái)。但是我們不能拿到數(shù)據(jù)庫(kù),拿到后端代碼。
大模型的問(wèn)題在于,今天的Transformer架構(gòu)很難把業(yè)務(wù)的長(zhǎng)鏈條解決得很好,這是Transformer本身的天花板所決定的,那我們就會(huì)想去解決其中的一部分問(wèn)題,其中一個(gè)就是“幻覺(jué)”。模型為什么產(chǎn)生幻覺(jué)?我們后來(lái)反復(fù)研究,發(fā)現(xiàn)它的根源其實(shí)還在最早的 Pre-train 階段,特別是反向傳播的機(jī)制本身就有偏差,那我們就看有什么更好的網(wǎng)絡(luò)結(jié)構(gòu)去改造。
所以我們自己的結(jié)論是:如果真的要解決問(wèn)題,必須從網(wǎng)絡(luò)結(jié)構(gòu)層面去動(dòng)刀,真正讓模型在 Pre-train 階段就變得更靠譜。這才是能帶來(lái)陡峭提升的地方。說(shuō)實(shí)話,從 DeepSeek-V2 發(fā)布到現(xiàn)在,我們看到整個(gè)行業(yè)在這方面的創(chuàng)新還很有限。那我們就自己想辦法解決了。
陳石:剛才宿文老師提到了“幻覺(jué)”這個(gè)問(wèn)題,我也非常認(rèn)同,這是當(dāng)前大模型能力的一個(gè)關(guān)鍵短板。而除了幻覺(jué),另一個(gè)普遍存在的技術(shù)瓶頸,就是上下文窗口的限制。我們現(xiàn)在看到很多代碼庫(kù)其實(shí)體量都非常大,很容易就超越了上下文窗口的上限。
此外,受限于當(dāng)前AI模型訓(xùn)練的機(jī)制,模型訓(xùn)練完成后就被凍住了,在運(yùn)行時(shí)一般不再做參數(shù)更新。而每個(gè)用戶在使用模型的時(shí)候,都需要某種程度的定制化,或者說(shuō)都需要有自己的上下文記憶,現(xiàn)在解決定制化的方法是靠應(yīng)用去存儲(chǔ)和捕捉上下文,以反復(fù)Prompt的方式傳遞給模型。這個(gè)成本很高,且運(yùn)行時(shí)間越長(zhǎng),Prompt長(zhǎng)度越大,每一個(gè)交互都需要費(fèi)大量token。現(xiàn)在雖然像 ChatGPT 引入了一些“記憶功能”,但我覺(jué)得還遠(yuǎn)遠(yuǎn)不夠。我認(rèn)為未來(lái)模型應(yīng)該可以直接“記住”你的上下文,讓它能像人一樣保有長(zhǎng)期記憶,而不是每次都靠 prompt 臨時(shí)加載。
我猜未來(lái)會(huì)有一些變化,要么是模型結(jié)構(gòu)上的,允許在運(yùn)行階段動(dòng)態(tài)調(diào)整參數(shù);要么是解決記憶存儲(chǔ)的安全與隱私問(wèn)題,比如如何以安全、可控的方式把用戶或企業(yè)的長(zhǎng)期上下文交給模型來(lái)處理。
AI 科技評(píng)論:亞飛總怎么看待這個(gè)問(wèn)題呢?
李亞飛:首先我挺佩服真正敢下場(chǎng)做大模型、做 Pre-train 的團(tuán)隊(duì),今天的大模型確實(shí)還有不少問(wèn)題和短板需要解決,而我認(rèn)為,在工程領(lǐng)域看待這些問(wèn)題,可以從兩個(gè)不同的視角入手。
第一個(gè)視角,是智能性,也就是大家經(jīng)常說(shuō)的“推理能力”。這一塊現(xiàn)在很多模型都在突破,比如陳石總剛才提到的上下文處理問(wèn)題的兩種思路:一種是直接把盡可能多的上下文“塞”進(jìn)模型中,另一種思路則是像人類那樣通過(guò)外部記憶進(jìn)行知識(shí)調(diào)用。實(shí)際上這波 Claude Code 展現(xiàn)了外腦獲取知識(shí)的能力,它會(huì)自己反思看代碼,現(xiàn)在我的測(cè)試結(jié)果是,它能把10 萬(wàn)級(jí)別的文件處理得也很好。
第二個(gè)視角,就是幻覺(jué)問(wèn)題。我覺(jué)得這和人類的想象力類似,某種程度上是生成能力的一部分,它可能永遠(yuǎn)無(wú)法被完全“消除”。但在 Coding 領(lǐng)域,我們能做的最好的方式是,給模型提供充分的tools,讓模型具備反思能力——也就是要能“犯錯(cuò)-覺(jué)察-修正”。
第三個(gè),我覺(jué)得大家經(jīng)常忽略掉的,就是我們要給它一個(gè)更強(qiáng)大的反饋系統(tǒng)。我們從工程領(lǐng)域看到的,比如debug類的信息,沒(méi)有給它。原來(lái)的debug是單步單點(diǎn),這是給人類設(shè)計(jì)的。其實(shí)AI不需要單步單點(diǎn),如果AI研究一會(huì)兒看不出錯(cuò)誤,它就跟你說(shuō),請(qǐng)你把調(diào)試器打開把那個(gè)錯(cuò)誤粘給我,然后我才能繼續(xù)。為什么我們不能把這個(gè)信息直接丟給AI呢?這些能力加上之后,AI的能力會(huì)明顯地變強(qiáng)變好。
目前來(lái)看,Claude 4.0 的智能性已經(jīng)相當(dāng)強(qiáng),從今年 6 月開始,真正屬于 Coding 領(lǐng)域的 Agentic 時(shí)刻已經(jīng)到來(lái)了。剩下的問(wèn)題無(wú)非就是,Cli是不是最好的形態(tài)了。
AI 科技評(píng)論:要想提升AI的編程能力,哪些東西是模型能做的?哪些是產(chǎn)品設(shè)計(jì)中能做的?
宿文:在我看來(lái),這兩方面還比較難拆開。模型迭代得很快,我們核心還是構(gòu)建數(shù)據(jù)飛輪。產(chǎn)品層面來(lái)看,工程也是很重要的一件事情。我們的模型和產(chǎn)品缺乏一個(gè)超級(jí)動(dòng)態(tài)規(guī)劃,其實(shí)大家今天都靜態(tài)得不能再靜態(tài)了。
那模型層要做什么呢?我覺(jué)得最核心的還是數(shù)據(jù)飛輪的構(gòu)建。之前美國(guó)紅杉開會(huì)的時(shí)候,幾乎沒(méi)有一家公司的CEO能說(shuō)清楚怎么構(gòu)建的。我們認(rèn)為,真正有效的數(shù)據(jù)飛輪一定從 Pre-train 階段開始。但 Pre-train 成本極高,不可能頻繁跑。所以關(guān)鍵在于怎么通過(guò)網(wǎng)絡(luò)結(jié)構(gòu)創(chuàng)新來(lái)支持“增量預(yù)訓(xùn)練”,而不是傳統(tǒng)意義上的增量微調(diào)(Post-train),從而讓token的權(quán)重可以快速地進(jìn)行動(dòng)態(tài)調(diào)整。這肯定是網(wǎng)絡(luò)結(jié)構(gòu)決定的,我們今天基本上能夠做到了。
然后你再看上下文的處理問(wèn)題。去年的上下文窗口競(jìng)爭(zhēng),一度“卷”到兆級(jí)上下文。但那其實(shí)更多是post-train層面的改造,不是真正從 Pre-train 層解決上下文編碼能力的問(wèn)題。比如去年 Magic.dev 的探索就很有代表性,他們認(rèn)為編程的卡點(diǎn)在大上下文,于是基于mamba的架構(gòu)去做了,雖然過(guò)程不順,但思路非常有價(jià)值。混合架構(gòu)加上位置編碼的方式,能不能把上下文擴(kuò)展到Mb級(jí)別?我覺(jué)得是可以的,那我們就這樣做了。
而從產(chǎn)品層面,我們關(guān)注的重點(diǎn)是用戶的真實(shí)表達(dá)能力。你的用戶可以是程序員,也可以是非程序員,甚至是完全不懂技術(shù)的“普通用戶”。關(guān)鍵在于你能否讓他們把自己的需求講清楚。而這恰恰是今天對(duì)話式交互里最大的挑戰(zhàn)。我們肯定去做社區(qū),做內(nèi)容沉淀讓更多的知識(shí)可復(fù)用;還有就是擺脫對(duì)話式,做圖形的交互方式等等。產(chǎn)品考慮的是用戶入口的事,模型考慮的是智能迭代的事。
AI 科技評(píng)論:明白。陳石總,從您作為投資人看過(guò)這么多產(chǎn)品的這個(gè)角度來(lái)看,您覺(jué)得呢?
陳石:我之前也做過(guò)技術(shù)和 CTO,雖然現(xiàn)在離技術(shù)有些遠(yuǎn)了,但對(duì)這個(gè)話題還是有一些感受。AI Coding 想要在未來(lái)真正發(fā)展起來(lái),我認(rèn)為核心在于“兩端能力”的協(xié)同推進(jìn):
一端是模型側(cè)能力的持續(xù)進(jìn)化,包括更強(qiáng)的邏輯推理、對(duì)上下文的理解與處理能力、以及上下文窗口的進(jìn)一步擴(kuò)展等等。這是模型層面的事。另一端則是應(yīng)用層的“上下文工程”。也就是說(shuō),產(chǎn)品要通過(guò)巧妙的設(shè)計(jì)和人機(jī)交互方式,幫助用戶清晰、完整地表達(dá)出他們的上下文和需求。
模型和應(yīng)用端面臨的挑戰(zhàn)就是,如何幫助那些邏輯表達(dá)不夠清晰的用戶,把他們真實(shí)的心理需求,以清晰的方式用自然語(yǔ)言的方式表達(dá)出來(lái)。
AI 科技評(píng)論:大多數(shù)基于 LLM 的編碼助手 AI Coding 的產(chǎn)品并不公開其內(nèi)部邏輯,所以我們很難去驗(yàn)證它生成代碼的準(zhǔn)確性,也不能夠去理解它為什么會(huì)做出來(lái)這樣的輸出,就沒(méi)有辦法去嵌入到真實(shí)的這個(gè)項(xiàng)目環(huán)境,但是Vibe Coding這個(gè)詞又很熱,所以我們應(yīng)該怎么去看待它的價(jià)值?
陳石:對(duì)于早期的嘗試性用戶,如果有一些編程基礎(chǔ),他們可能覺(jué)得比較好。我們要認(rèn)識(shí)到Vibe Coding還是一個(gè)原型驗(yàn)證的階段,偏向于把創(chuàng)意激發(fā)出來(lái)。
有些人可以告訴AI,你給我寫個(gè)貪吃蛇游戲,它就寫出來(lái)了。因?yàn)檫@是一個(gè)很容易的代碼。如果是一個(gè)復(fù)雜的東西,受限于人類的自然語(yǔ)言表達(dá)能力,和當(dāng)前的語(yǔ)言模型的編程能力,還是比較難的。所以不要把快速做出貪吃蛇當(dāng)回事,這只是個(gè)很簡(jiǎn)單的功能,甚至不需要大語(yǔ)言模型。
我們的訴求是,產(chǎn)品側(cè)幫助用戶把真實(shí)需求以規(guī)范的產(chǎn)品文檔方式表達(dá)出來(lái),以及在模型側(cè)怎么形成好的軟件工程范式,這兩段的努力能夠讓Vibe Coding產(chǎn)生更大的價(jià)值。
AI 科技評(píng)論:宿文總好像對(duì)貪吃蛇這種游戲類可以說(shuō)幾句。
宿文:游戲是個(gè)非常復(fù)雜的事情。今天大家看到 AI 做馬里奧、貪吃蛇這些案例,確實(shí)能跑通,更多是因?yàn)檫@些場(chǎng)景早已有很多類似樣本,模型能“見(jiàn)多識(shí)廣”,所以比較容易實(shí)現(xiàn)。
我不太喜歡Vibe Coding 這個(gè)詞,但是今天到底能做到哪一步?目前典型產(chǎn)品,比如lovable、bolt.new 甚至更早一些的工具,確實(shí)已經(jīng)能做到做出原型,而原型這件事在很多場(chǎng)景下本身就已經(jīng)很有價(jià)值了。它能夠幫助開發(fā)者省去大量方案設(shè)計(jì)、產(chǎn)品需求撰寫和原型構(gòu)建的工作,所以才會(huì)有那么大的用戶量。
我們更關(guān)注的是下一步:如何進(jìn)入真正的生產(chǎn)環(huán)境,并贏得用戶信任。過(guò)去由人來(lái)寫代碼,哪怕出錯(cuò)也能溯源、有人背鍋。但今天基于大語(yǔ)言模型的代碼生成,本質(zhì)上是概率模型,天然帶有不確定性。如何讓用戶信任這種“不確定性里的生產(chǎn)力”?這需要分階段、分角度來(lái)推進(jìn)。以前只有少數(shù)程序員能夠做的高階工程,以后也會(huì)以token的形式交付出來(lái),這樣一步一步驗(yàn)證它的安全性,慢慢影響用戶心智,從而進(jìn)入生產(chǎn)環(huán)境。
到底要不要放開源代碼,我們持相對(duì)開放的態(tài)度,有一個(gè)問(wèn)題是,一旦放開,用戶再一改代碼,整個(gè)deploy環(huán)境就亂套了,也就破壞完整的數(shù)據(jù)閉環(huán)了。
AI 科技評(píng)論:為什么不喜歡Vibe Coding這個(gè)詞?
宿文:國(guó)內(nèi)最主流的翻譯是氛圍編程,這感覺(jué)不是一個(gè)能進(jìn)生產(chǎn)環(huán)境的詞。
李亞飛:有一個(gè)詞更合適,叫松弛編程,就是我心情比較輕松,氛圍編程就好像是在玩,瞎搞。
今天我們對(duì)此有兩個(gè)矛盾。第一個(gè)矛盾是:來(lái)自業(yè)務(wù)側(cè)的“小白用戶”,他們很多都是非常專業(yè)的商業(yè)人士,只是完全不懂編程。但他們有明確的需求,想自己動(dòng)手做一個(gè)應(yīng)用。然而現(xiàn)實(shí)是,哪怕今天的工具已經(jīng)進(jìn)步了很多,這種需求和能力之間還是沒(méi)有完全拉齊。所以 Vibe coding 才會(huì)在某些圈子里被嫌棄——因?yàn)樗o了用戶“好像能搞定一切”的錯(cuò)覺(jué)。
第二類矛盾是:專業(yè)工程師的認(rèn)知正在迅速分化。我最近觀察到一個(gè)有趣的現(xiàn)象:本來(lái)就是“十倍效率”的高階工程師,在接入“松弛編程”之后,效率能再提升十倍,甚至達(dá)到百倍。普通的工程師,只要用對(duì)方法,也能獲得顯著提升。還有一些工程師是堅(jiān)決反對(duì)甚至排斥的。但這并不代表他們錯(cuò)了——可能只是因?yàn)檫€沒(méi)真正看到這些工具的威力。我自己就反復(fù)橫跳了兩次,但是它一次次改變了我的想法。
我們現(xiàn)在早就不是貪吃蛇可以一鍵生成的時(shí)代,Vibe Coding已經(jīng)可以做到 one-shot 生成一個(gè)完整的官網(wǎng)頁(yè)面,甚至借助它做點(diǎn)外包項(xiàng)目。今天的一些工程師已經(jīng)可以通過(guò)松弛變成搞定 C3、C4 復(fù)雜度的項(xiàng)目,包括后臺(tái)、數(shù)據(jù)庫(kù)等全套系統(tǒng)。
這類能力距離“完全小白用戶”使用還有一段距離,當(dāng)然,也可能未來(lái)永遠(yuǎn)不會(huì)出現(xiàn)“完全小白用戶”能獨(dú)立做工程的那一天。畢竟軟件開發(fā)本質(zhì)上是軟硬工程結(jié)合的復(fù)雜工作——懂行的人都知道它有多難。但有一點(diǎn)是可以肯定的:未來(lái)的開發(fā)過(guò)程一定是“松弛的”,以后的工程師都是業(yè)務(wù)邏輯式的,技術(shù)水平只需要以前的三分之一,但是他們能捋清商業(yè)邏輯,捋清產(chǎn)品邏輯。
如果你本身就掌握了編程技能,在 Vibe Coding 這個(gè)浪潮里,你依然能夠做到比別人高出十倍的效率。
AI 科技評(píng)論:以后Vibe Coding會(huì)公開代碼嗎?
李亞飛:我的答案是應(yīng)該公開。它的本質(zhì)還是代碼,還是資產(chǎn),誰(shuí)都能來(lái)接管。自動(dòng)駕駛的汽車司機(jī)也能接管, 只是沒(méi)必要。
AI 科技評(píng)論:正好也銜接我們接下來(lái)的話題。現(xiàn)在大家都在討論:為什么Claude Code能在這么短的時(shí)間里積累起這么大的聲量,獲得這么多用戶的轉(zhuǎn)化?是、因?yàn)樗茿nthropic的產(chǎn)品?還是說(shuō)它在產(chǎn)品形態(tài)或能力上真做出了重大突破?
李亞飛:我的體感可能會(huì)更強(qiáng)一些。我覺(jué)得它在形態(tài)上是“開了倒車”的——它回到了 30 年前命令行程序那一套,甚至可以說(shuō)是 GUI 出現(xiàn)之前、60 年代那種技術(shù)形態(tài)。產(chǎn)品定義上是倒車的,但是程序員是相對(duì)能接受的。
它之所以爆火,關(guān)鍵在于它非常充分地激發(fā)了 Claude 4.0 的智能能力。它幾乎不需要很長(zhǎng)的上下文,也不依賴太多的人類提示或“補(bǔ)丁”,就能產(chǎn)生足夠好的智能性。所以我覺(jué)得這是一個(gè)真正的 Agentic 工具。
基模在ChatGPT3.5那個(gè)時(shí)代,它只能做補(bǔ)全,而且還只是一些小文件,所以只能做Copilot,后來(lái)到了Claude 3.5,大家發(fā)現(xiàn)我們能跟AI有一些基本的對(duì)話了,可以做出一些功能性的能力了,現(xiàn)在到了Agent的階段,但是AI也沒(méi)強(qiáng)到那種程度,只能算是初中級(jí)工程師。
我認(rèn)為 CLI 最終不是未來(lái),未來(lái)一定是云端、多工協(xié)作的模式。Agent就像是一個(gè)工程師,以后雇一個(gè)工程師不滿意的話,就雇三個(gè)、五個(gè),多開多干。
AI 科技評(píng)論:我覺(jué)得“倒退”也未必是壞事。宿文老師,您怎么看?
宿文:這個(gè)問(wèn)題可能亞飛總更專業(yè)一些,因?yàn)槲易约弘x開寫代碼已經(jīng)挺久了,嚴(yán)格來(lái)說(shuō)我既不是Claude Code也不是 Cursor 的典型用戶。
從我們內(nèi)部的觀察來(lái)看,真正的源頭,還是看誰(shuí)掌握模型。lovable也好、Cursor也好,一定程度上都是Claude的token的二道販子。特別是在這樣一個(gè)早期且劇烈變化的階段,握有底層模型能力的一方必然占據(jù)更多主動(dòng)權(quán)。我認(rèn)為歸根結(jié)底,今天還是誰(shuí)握著模型、誰(shuí)的主動(dòng)性就更強(qiáng)。
AI 科技評(píng)論:陳石總以前做過(guò)CTO, 您怎么看Claude Code?
陳石:我覺(jué)得Claude Code 之所有受到好評(píng),主要原因首先是它的上下文工程做得好,畢竟沒(méi)有人比模型廠商更知道如何全面、有效率地向模型提供它完成任務(wù)需要的Prompt。其次是Claude Code剛好有些取巧,它當(dāng)前只提供命令行界面(CLI),愿意且有能力使用CLI來(lái)編程的人大部分是有經(jīng)驗(yàn)的程序員,而這批人更有能力取得好的體驗(yàn)。
據(jù)Anthropic公司的統(tǒng)計(jì),Claude Code上80%的左右使用的是Agent功能,而Cursor上只有50%,這也是CLI界面上編程序的特點(diǎn),它相對(duì)于圖形界面(GUI)是不友好的,做深度復(fù)雜的編程是很難的,程序員要在這么多文件上來(lái)來(lái)回回切來(lái)切去也很麻煩,所以大家更愿意去用Claude Code的Agent功能,這也讓它有了更大的聲量。
李亞飛:對(duì)一些老程序員來(lái)說(shuō),Cli做開發(fā)比較快。
陳石:還有我覺(jué)得前端還是有很多價(jià)值的,否則Google也不會(huì)發(fā)那么多錢去收購(gòu)windsurf,這可能也是我們應(yīng)用創(chuàng)業(yè)的一個(gè)機(jī)會(huì)吧。
AI 科技評(píng)論:我下一個(gè)問(wèn)題就想請(qǐng)陳石總先談?wù)劇狝gent 未來(lái)有沒(méi)有可能成為研發(fā)流程里的核心 Controller 或 Planner?從您目前的觀察來(lái)看,這個(gè)路徑是否已經(jīng)成為業(yè)界的共識(shí)?
陳石:從趨勢(shì)上來(lái)看,確實(shí)有越來(lái)越多創(chuàng)業(yè)公司涌向 Agent 路線。Copilot 這個(gè)方向現(xiàn)在難度太高了,海外大廠都在做,比如微軟的GitHub Copilot ,此外Cursor這些領(lǐng)先的創(chuàng)業(yè)公司也做得不錯(cuò)。你再去從頭做一個(gè) Copilot,幾乎沒(méi)有多少空間了。所以很多人選擇了 Agent 這條路線。
Agent 作為 Controller 和 Planner,雖然當(dāng)前取得一些進(jìn)步,但是現(xiàn)在還談不上成熟。你讓它去做一個(gè)深度的任務(wù)規(guī)劃,或者真的做一個(gè)“項(xiàng)目經(jīng)理”角色,其實(shí)還是非常困難的。何況讓它寫對(duì)邏輯性和一致性要求非常高的代碼,稍微復(fù)雜一點(diǎn)可能連編譯都通不過(guò)。
雖然 Agent 的方向是對(duì)的,但要走通它還面臨很多挑戰(zhàn)。未來(lái)模型能力會(huì)提升,這是肯定的;但在這個(gè)過(guò)程中,我們必須有一套流程設(shè)計(jì),讓人類能夠參與其中,承擔(dān)監(jiān)督和反饋的角色。哪怕是做標(biāo)注、做獎(jiǎng)勵(lì)反饋,只要能把人類嵌進(jìn) Agent 的工作流中,Agent 的表現(xiàn)就會(huì)更好。
現(xiàn)在最大的問(wèn)題是,Agent 做完一整套操作之后,大部分情況要么完全跑不通,要不跑通但不符合用戶需求,且普遍存在用戶反饋滯后稀疏的情況。這種反饋結(jié)果非常不利于模型做強(qiáng)化學(xué)習(xí)。所以關(guān)鍵還是流程設(shè)計(jì):要讓人類愿意提供高質(zhì)量的反饋,讓模型在過(guò)程中就能獲得獎(jiǎng)勵(lì)信號(hào),這樣才能真正訓(xùn)練出一個(gè)好用的 Agent。
AI 科技評(píng)論:亞飛總您怎么看?現(xiàn)在做 Agent 是不是已經(jīng)成為行業(yè)共識(shí)?
李亞飛:我覺(jué)得“成為共識(shí)”可能還言之尚早。我今天最大的任務(wù),就是想告訴大家——Agent 應(yīng)用,尤其是在 Coding 領(lǐng)域,已經(jīng)可以用了。
現(xiàn)在很多人還是將信將疑的。其實(shí)那么多大廠、那么多團(tuán)隊(duì),就像微軟早早地做了 Copilot,結(jié)果看著Cursor做了起來(lái),我覺(jué)得其實(shí)是大廠內(nèi)部沒(méi)有那么篤信。
你看中國(guó)的大廠,還在搞IDE呢,Cursor都被彎道超車一個(gè)月了。有些大廠還希望你把模型私有化進(jìn)去,做Copilot。
宿文:我們從第一天就認(rèn)為,Agent肯定是未來(lái),但是就怕它不是這一波泡沫中應(yīng)該出現(xiàn)的事兒呢。
我覺(jué)得Coding Agent在這一波技術(shù)周期還是能落地很多場(chǎng)景的,但是現(xiàn)在仍然是完全不成熟的狀態(tài)。我們自己內(nèi)部討論的時(shí)候,有人說(shuō)超級(jí)動(dòng)態(tài)planning,要讓產(chǎn)品很靈活,效果又都有保障,結(jié)果我們發(fā)現(xiàn),底層的給Agent做的infra是完全不完善的。我們期待會(huì)有一些更好的Agent框架,如果出現(xiàn)了,我們就快速地?fù)肀?,同時(shí)我們自己也在做一些突破。目前來(lái)看還是有瓶頸的。
AI 科技評(píng)論:那你們有哪些嘗試呢?
宿文:我們目前最核心的探索,其實(shí)還是聚焦在“如何更靈活地滿足用戶的個(gè)性化需求”上。因?yàn)槿绻阋峁┮粋€(gè)端到端的方案,首先是你整個(gè)技術(shù)棧得非常完整,其次是要面對(duì)用戶非常長(zhǎng)尾分散的需求。
現(xiàn)在不管是Manus還是Devin提出的一些東西,我們都不太能夠借鑒得上,我們先一步步地做自己的生成式軟件agent架構(gòu),未來(lái)留待擁抱更多的靈活性。
AI 科技評(píng)論:確實(shí),agent 的能力和未來(lái)的落地還存在很多挑戰(zhàn)。請(qǐng)陳石總從更宏觀的角度聊聊,您怎么看待 AI Coding Agent 生態(tài)的發(fā)展?
陳石:我覺(jué)得可以抽象為兩個(gè)關(guān)鍵方向:第一,是基礎(chǔ)設(shè)施層面的統(tǒng)一,尤其是要為 agent 或 AI 特別設(shè)計(jì)的一整套基礎(chǔ)設(shè)施;第二,是協(xié)作與監(jiān)督工具的完善,讓人類和 AI 能更高效地協(xié)作,同時(shí)對(duì) AI 有一定可控性。
比如 OpenAI 的 CodeX、Claude Code 模塊等,都會(huì)配套一些沙盒環(huán)境。這類“安全可控”的運(yùn)行環(huán)境非常關(guān)鍵,因?yàn)樽詈玫尿?yàn)證方式,其實(shí)就是讓 Agent 在虛擬環(huán)境先跑一遍,這類基礎(chǔ)設(shè)施非常重要。我覺(jué)得這一類產(chǎn)品會(huì)慢慢成為一個(gè)既安全又能形成標(biāo)準(zhǔn)的一個(gè)運(yùn)行環(huán)境。還有就是用戶端的長(zhǎng)期記憶和上下文共享的機(jī)制,包括MCP、一些向量數(shù)據(jù)庫(kù)等等。
再說(shuō)協(xié)作監(jiān)督工具。如何讓一個(gè)邏輯能力弱一點(diǎn)的用戶,也能把需求準(zhǔn)確表達(dá)出來(lái)?這個(gè)過(guò)程需要一整套引導(dǎo)機(jī)制。
還有一個(gè)特別重要但現(xiàn)在缺失的東西是可視化調(diào)試工具?,F(xiàn)在的大模型像個(gè)黑盒,用戶不知道它為啥出錯(cuò)、哪里錯(cuò)了,就跟自動(dòng)駕駛的 corner case 一樣,你沒(méi)有辦法預(yù)警,也很難修復(fù)。如果能有像儀表盤那樣的可視化系統(tǒng),讓人可以在高層級(jí)上看清 AI 的“決策路徑”,那人就能更有效地“標(biāo)注” agent 的行為,形成一個(gè)更健康的閉環(huán)反饋系統(tǒng)。
所以總結(jié)來(lái)說(shuō),基礎(chǔ)設(shè)施統(tǒng)一和協(xié)作監(jiān)督機(jī)制,是 agent 生態(tài)目前最需要補(bǔ)足的兩大塊。
AI 科技評(píng)論:那這些工作應(yīng)該主要由誰(shuí)來(lái)做?是 Agent 開發(fā)者、平臺(tái)方,還是說(shuō)這其實(shí)是很適合創(chuàng)業(yè)團(tuán)隊(duì)切入的機(jī)會(huì)?
陳石:關(guān)鍵是判斷哪些模塊是適合做在應(yīng)用層的,哪些模塊適合在模型層做。像我們投資的做一體化 Agent 工作環(huán)境的產(chǎn)品,就是一個(gè)創(chuàng)業(yè)團(tuán)隊(duì)在做。你可以從 Infra 層切入,也可以從應(yīng)用層往下扎。比如 Cursor 本身做了很多前端上的交互設(shè)計(jì),它也在做一些記憶機(jī)制、上下文優(yōu)化,還有數(shù)據(jù)收集與回溯能力,這些也都在增強(qiáng) Agent 的協(xié)作能力。所以說(shuō)這些事,應(yīng)用開發(fā)者和平臺(tái)方其實(shí)都可以做。
AI 科技評(píng)論:宿文總,您在市場(chǎng)上有看有接觸過(guò)這樣的公司,或者是有這些需求嗎?
宿文:我們從 2023 年底決定切入這個(gè)領(lǐng)域開始,就特別關(guān)注,在未來(lái)的研發(fā)與商業(yè)化過(guò)程中,會(huì)存在哪些“生態(tài)型卡點(diǎn)”會(huì)讓這種不確定性非常高,所以前期規(guī)劃的時(shí)候我們盡可能把能規(guī)避的都規(guī)避了。
我們看到的比較大的,我們嘗試解決,也希望產(chǎn)業(yè)鏈的小伙伴能共同解決的一個(gè)難點(diǎn)就是,生成式數(shù)據(jù)庫(kù)。因?yàn)槲覀兘裉熳龅拇蠖鄶?shù)場(chǎng)景,仍然集中在 CRUD 類型的系統(tǒng)開發(fā)上,而這個(gè)場(chǎng)景上最重要的就是數(shù)據(jù)庫(kù)。
我們今天做的還是相對(duì)簡(jiǎn)單的獨(dú)立系統(tǒng),但是人類至少積累了三四十年的數(shù)據(jù)資產(chǎn),大量企業(yè)從 90 年代就開始使用 ERP 系統(tǒng),里頭積累了三四十年的合規(guī)數(shù)據(jù)、進(jìn)銷存數(shù)據(jù),后面一代代的系統(tǒng)都是在這個(gè)系統(tǒng)上去做增量開發(fā),或者疊加的。那么大模型時(shí)代生成的內(nèi)容跟歷史內(nèi)容之間的交互關(guān)系在哪兒?這是我們認(rèn)為在端到端這件事情上比較大的卡點(diǎn)。
李亞飛:大家今天聊到了很深的場(chǎng)景話題。我們相信“端到端生成”就是未來(lái),在AI能力不斷變強(qiáng)的情況下,端對(duì)端的核心邏輯就兩個(gè):第一,是一個(gè)真正的Agent在工作。 未來(lái)一定不是 prompt based 的一次性交互,而是一個(gè)智能體,真正作為開發(fā)者參與到項(xiàng)目全流程中。第二,今天人類在架構(gòu)設(shè)計(jì)、系統(tǒng)認(rèn)知上的優(yōu)勢(shì)仍然遠(yuǎn)超 AI,所以我們就應(yīng)該把這些難點(diǎn)提前替 AI 處理好,給它創(chuàng)造一個(gè)“可控的工作空間”。
哪些難點(diǎn)呢?宿文剛才說(shuō)的數(shù)據(jù)庫(kù)是一個(gè),還有就是框架選型,根據(jù)需求匹配最合適的語(yǔ)言架構(gòu)。我們幫助Agent把這個(gè)運(yùn)行環(huán)境給準(zhǔn)備好,對(duì)于非專業(yè)工程師來(lái)說(shuō),這就是Agent的工作區(qū)。萬(wàn)事俱備,我們最終才能塑造一個(gè)真正意義上的端對(duì)端APP的交付。
AI 科技評(píng)論:那下一個(gè)問(wèn)題是一個(gè)現(xiàn)實(shí)但可能略顯“悲觀”的議題:我們現(xiàn)在看到 AI 在生成代碼的過(guò)程中,會(huì)大量制造“垃圾代碼”,因?yàn)槌杀咎?,?dǎo)致很多大廠的代碼庫(kù)越來(lái)越龐雜、難以維護(hù)。這是一個(gè)真的需要擔(dān)心的問(wèn)題,還是只是個(gè)“杞人憂天”?
李亞飛:這個(gè)問(wèn)題絕對(duì)是現(xiàn)實(shí)存在的,而且已經(jīng)非常廣泛。因?yàn)榻裉靋ode寫起來(lái)實(shí)在太容易了, 大模型傾向于寫點(diǎn)code去幫你解決問(wèn)題,我就親眼見(jiàn)過(guò),它寫了一個(gè)不work,它順手在下面又寫了一個(gè),最后一塊交給我了。
解決這個(gè)問(wèn)題的思路并不復(fù)雜,人類是有版本管理的,代碼推送之后是要確認(rèn)的,如果你是一個(gè)比AI更好的工程師,你就在確認(rèn)環(huán)節(jié)把它這些不太好的方案干掉。
其他的解決思路還有,在 prompt 設(shè)計(jì)和上下文設(shè)計(jì)里面要充分地讓 AI 知道不要瞎寫東西,盡可能多約束AI,隨時(shí)打斷。
宿文:我們其實(shí)完全沒(méi)擔(dān)心過(guò)“生成垃圾代碼”這件事。這種現(xiàn)象在歷史上都出現(xiàn)過(guò)。比如在知識(shí)傳播這件事上,從古代口耳相傳到現(xiàn)代信息爆炸的時(shí)代,我們也沒(méi)擔(dān)心過(guò)這個(gè)事兒。
當(dāng)然,這個(gè)類比未必完全貼切。但如果我們要精準(zhǔn)地回答這個(gè)問(wèn)題,其實(shí)很簡(jiǎn)單:你不進(jìn)生產(chǎn)環(huán)境,代碼再臟也是工程師的事情。至于工程師在這個(gè)過(guò)程中如何轉(zhuǎn)變角色、如何管理質(zhì)量,那是另一個(gè)話題。
所以,我們完全不會(huì)擔(dān)心這會(huì)影響到軟件的實(shí)際使用者。這個(gè)問(wèn)題是可以解決的,而且應(yīng)該在提升效率之后再回頭解決質(zhì)量問(wèn)題。就像生成式數(shù)據(jù)庫(kù)的問(wèn)題,我們會(huì)基于存量的各種各樣的 數(shù)據(jù)庫(kù)構(gòu)建今天的系統(tǒng),但是我們知道未來(lái)新的IT架構(gòu)會(huì)倒逼新的 Infra 產(chǎn)生。
同樣的一個(gè)字段,在不同的軟件開發(fā)廠商的數(shù)據(jù)中可能明明完全不一樣,那就需要后端程序員通過(guò)API等業(yè)務(wù)理解去做的。大模型去跨系統(tǒng)去理解這個(gè)事情是很難的,一定要做語(yǔ)義貼合,不然成本太高,所以我們只能停留在上一代的數(shù)據(jù)庫(kù)形態(tài)上。但是人類有個(gè)特點(diǎn),只要倒逼到那一步,大概率也有聰明腦袋能解決。
陳石:我也同意大家的看法。這個(gè)問(wèn)題是存在的,但不需要過(guò)度焦慮。放眼整個(gè)互聯(lián)網(wǎng),我們已經(jīng)充滿了“垃圾數(shù)據(jù)”了,但并沒(méi)有因此停滯。更重要的是,代碼和文本不同,它具有結(jié)構(gòu)性、邏輯性和可驗(yàn)證性——你寫得好不好,其實(shí)能跑一遍測(cè)試就知道了。
在編程世界里,有很多方法論可以幫助我們做代碼質(zhì)量篩選,比如 lint 工具、單元測(cè)試、代碼審查等等。更重要的是,AI 現(xiàn)在也能調(diào)用這些工具自動(dòng)檢測(cè)代碼。我相信有朝一日,AI 寫出的代碼質(zhì)量會(huì)超過(guò)大部分普通程序員。
李亞飛:大家為什么會(huì)關(guān)心這個(gè)問(wèn)題呢?我覺(jué)得本質(zhì)上,軟件是一種負(fù)債,生產(chǎn)出來(lái)的軟件,你就得維護(hù)它,你不維護(hù)它就像一個(gè)生命一樣就要死掉了。如果你寫出來(lái)剛剛好能work的代碼,沒(méi)有及時(shí)消除你的債務(wù)的話,它就指向了一種持續(xù)維護(hù)的成本,這就有個(gè)隱形的雷。
軟件工程里面這個(gè)問(wèn)題還是比較嚴(yán)重的,必須要消除掉。我們不能說(shuō)這一代程序員寫出來(lái)就不管了,等下一代程序員來(lái)了接手這個(gè)“屎坑”。
陳石:這個(gè)問(wèn)題最終的解決不在于代碼上,有可能就在于你的prompt提煉出來(lái)的產(chǎn)品規(guī)范上。如果產(chǎn)品規(guī)范定義得足夠優(yōu)質(zhì),下一次你換個(gè)架構(gòu)或換種編程語(yǔ)言去重寫一遍代碼問(wèn)題也不大了。
李亞飛:站在產(chǎn)品角度,我們把它叫做產(chǎn)品架構(gòu),站在技術(shù)角度,我們把它叫做技術(shù)架構(gòu),這是兩位一體的東西,也是一個(gè)好產(chǎn)品的核心骨架。只要骨架還在,外圍的代碼爛一點(diǎn)關(guān)系不大。
AI 科技評(píng)論:最后一個(gè)問(wèn)題,我們今天討論了很多 AI Coding 的進(jìn)展。那放眼未來(lái),它可能會(huì)徹底改變?nèi)祟惻c代碼的交互方式。你們認(rèn)為程序員的工作會(huì)發(fā)生什么樣的變化?映射一下我們今天的主題,AI 顛覆的第一個(gè)職業(yè),會(huì)是程序員嗎?
宿文:好的技術(shù)一定是通過(guò)創(chuàng)造供給的方式,激發(fā)出更多需求。當(dāng)然,第一階段一定是服務(wù)于“已有程序員”的——讓他們用得更爽、更高效,尤其在一些高度垂直、封閉的場(chǎng)景,比如半導(dǎo)體領(lǐng)域的 firmware 這套軟件的開發(fā),這不可能是大模型能做的事情,反而是這些程序員可以利用好 AI,工作質(zhì)量可能更上一層樓。所以會(huì)有很多垂類場(chǎng)景長(zhǎng)期存在。
但在另一些場(chǎng)景中,程序員的角色可能真的會(huì)被“再定義”。比如很多行業(yè)其實(shí)需要的只是把業(yè)務(wù)需求“翻譯”為軟件,但因?yàn)楣┙o的效率、供給的成本、供給的質(zhì)量等等限制,這個(gè)需求長(zhǎng)期被壓抑。現(xiàn)在有了 AI,門檻降低了,大量非技術(shù)用戶就能用 token 去完成代碼生成,觸發(fā)出新的增量市場(chǎng)。這些也是我們的商業(yè)模式的范圍。
既然以后所有的代碼是依賴于token實(shí)現(xiàn)的,那就把它變成infra,變成infra的時(shí)候,Coding的收費(fèi)邏輯也會(huì)發(fā)生改變的。這些是5年之內(nèi)可以預(yù)期到的事情。
AI 科技評(píng)論:那亞飛總,您是程序員出身,肯定感受更深。
李亞飛:是,我本身就是工程師出身,所以體會(huì)確實(shí)很直接。我覺(jué)得可以用一句話總結(jié):打孔的人不需要了,但懂打孔機(jī)原理的人仍然有價(jià)值。早期的程序員其實(shí)就是在打孔、輸入程序,那種工種確實(shí)消失了。
沒(méi)有AI干得好的人,確實(shí)不需要了。但好消息是——懂底層原理的人,在新的體系中會(huì)更加值錢。他們會(huì)成為“維護(hù)打孔機(jī)的人”,會(huì)更快地適應(yīng)新范式。同時(shí),這也意味著新工種的誕生。這是一個(gè)新的工作機(jī)會(huì),因?yàn)樯a(chǎn)軟件變得更便宜了,個(gè)性化軟件需求時(shí)代會(huì)到來(lái)。新時(shí)代生產(chǎn)軟件的人,我姑且稱之為“業(yè)務(wù)邏輯師”。
陳石:未來(lái)發(fā)展的瓶頸就變成了人和AI結(jié)構(gòu)化的溝通。今天程序員真正寫代碼的時(shí)間,其實(shí)只占工作量的 20%-30%,大多數(shù)時(shí)間花在溝通、邏輯整理和系統(tǒng)設(shè)計(jì)上。如果模型越來(lái)越強(qiáng),它不僅能寫出高質(zhì)量代碼,甚至可以自動(dòng)挑選最合適的語(yǔ)言、架構(gòu)和實(shí)現(xiàn)方式。那時(shí)候,真正的“源代碼”可能是你在AI幫助下寫出來(lái)的產(chǎn)品規(guī)范文檔。
這份“文檔”可以是自然語(yǔ)言、流程圖、界面草圖的組合,它的結(jié)構(gòu)清晰度越高,AI 實(shí)現(xiàn)的準(zhǔn)確性就越好。而未來(lái)的 IDE,也許不再是代碼編輯器,而是一個(gè)“集成思維澄清器”——幫你厘清思路、表達(dá)邏輯、形成規(guī)范,剩下的都交給 AI。
到那時(shí),程序員的核心能力,可能不是寫代碼,而是能不能清晰表達(dá)需求、構(gòu)建邏輯架構(gòu)。這也印證了剛才亞飛總說(shuō)的“業(yè)務(wù)邏輯師”這個(gè)概念——甚至我覺(jué)得一些邏輯性強(qiáng)的職業(yè),比如律師,都可能在這個(gè)新工種中如魚得水。
AI 科技評(píng)論:三位的回答其實(shí)都不約而同地指向一個(gè)趨勢(shì):未來(lái)的程序員,也許不是“代碼工匠”,而是“業(yè)務(wù)翻譯者”和“需求架構(gòu)師”。寫代碼這件事,逐漸被抽象掉,真正有價(jià)值的,是結(jié)構(gòu)化表達(dá)與邏輯構(gòu)建的能力。
至于“AI 顛覆的第一個(gè)職業(yè)是不是程序員”——可能不是簡(jiǎn)單的“被替代”,而是徹底的“角色轉(zhuǎn)變”。
非常感謝宿文老師、陳石老師、李亞飛老師,今天的分享非常深入且富有啟發(fā)。這次圓桌分享到這里就正式結(jié)束了,謝謝大家!雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。