AI 顛覆的第一個(gè)職業(yè)是程序員？丨GAIR Live

本文作者：鄭佳美

2025-08-06 15:09

導(dǎo)語：寫代碼的退場，調(diào)度 AI 的上桌。

當(dāng) AI 大模型飛速進(jìn)化，最先被卷入洪流的，不是寫作畫畫或運(yùn)營，而是程序員。過去幾年，從 GitHub Copilot 開始，到 Cursor、Codeium、Claude Code，再到各類 Agent 框架如雨后春筍般涌現(xiàn)，AI 開始進(jìn)入代碼世界，試圖不僅寫代碼、補(bǔ)代碼，更要理解工程、構(gòu)建系統(tǒng)，乃至在沒有人的指令下完成一次次自動(dòng)迭代。

這場看似技術(shù)層面的革新，其實(shí)正在悄然重塑整個(gè)軟件開發(fā)范式，也讓“AI 是否將程序員作為第一個(gè)被顛覆的職業(yè)”成為一個(gè)日益無法回避的問題。

然而，顛覆，從來不是一個(gè)單向度的詞。AI Coding 正在打開的是一條分叉的路徑：在存量程序員眼中，它是效率的躍遷工具，是寫代碼的新搭子；在非程序員眼中，它是一種“去編程化”的自由工具，是一種“用自然語言造軟件”的全新可能。而在真正理解軟件工程的人看來，AI Coding 更像是剛剛起步的“工程幼兒園”：離真實(shí)的復(fù)雜協(xié)作、架構(gòu)設(shè)計(jì)、上下文演進(jìn)與嚴(yán)肅生產(chǎn)環(huán)境仍有巨大距離。

7 月 19 日上午，AI 科技評(píng)論組織了一場圍繞“AI Coding”的線上圓桌，請到了三位長期深耕于 AI Coding 領(lǐng)域的代表人物：峰瑞資本的投資合伙人陳石、Auto Coder 創(chuàng)始人宿文與 ClackyAI 創(chuàng)始人李亞飛。他們的身份橫跨資本、模型與產(chǎn)品，也代表了對這個(gè)問題的三種路徑觀察。

以下是此次討論的精彩分享，雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng)) AI 科技評(píng)論進(jìn)行了不改原意的編輯整理：

從輔助工具到工程變革

AI 科技評(píng)論：歡迎大家來到今天的 GAIR Live 直播論壇。本場主題是 “AI 顛覆的第一個(gè)職業(yè)會(huì)是程序員嗎？”我們的第一次問題：什么才叫 AI Coding？它與傳統(tǒng)軟件工程（SWE）有什么區(qū)別？AI 是否可能成長為一種新的工程范式？下面先請陳石來分享他的看法。

陳石：我理解的 AI Coding，如果從狹義角度來看，目前更多指的是AI 自動(dòng)生成或補(bǔ)全代碼，甚至是自動(dòng)完成整個(gè)代碼編寫過程。但這個(gè)“完成”往往并不符合真正的軟件工程范式，也很難滿足我們在軟件開發(fā)中常提到的一些規(guī)范性要求。

當(dāng)然，未來的 AI Coding 一定會(huì)朝著更工程化的方向演進(jìn)。它不僅要遵循現(xiàn)有的軟件工程規(guī)范，甚至可能會(huì)發(fā)展出一種全新的工程范式。這種范式不僅要求 AI 能寫代碼，還要求它能參與整個(gè)開發(fā)流程：從需求拆解、架構(gòu)規(guī)劃，到代碼生成、測試驗(yàn)證、持續(xù)集成部署（CICD），甚至包括多智能體協(xié)作、自我修復(fù)、持續(xù)迭代等關(guān)鍵環(huán)節(jié)。

所以，我認(rèn)為今天我們看到的 AI Coding，還處于非常早期的原型階段，只能在局部場景中解決一些簡單問題。但它的未來潛力不容低估——它會(huì)從生成“demo 級(jí)”的小程序，發(fā)展到真正具備構(gòu)建大規(guī)模、復(fù)雜系統(tǒng)能力的工具。這才是我眼中 AI Coding 的真正方向。

AI 科技評(píng)論：所以目前來看，AI Coding 還處在一個(gè)比較早期的階段，確實(shí)還無法真正達(dá)到軟件工程的標(biāo)準(zhǔn)。那接下來想請宿文老師談?wù)勀目捶ā?/p>

宿文：我們觀察到，今天 AI Coding 的產(chǎn)品形態(tài)，基本可以分為兩大類，它們分別對應(yīng)兩類主要用戶。第一類是存量的程序員用戶。從最早的 GitHub Copilot，到后來的 Cursor、最近的Claude Code，這類工具主要圍繞開發(fā)者的 IDE 環(huán)境，提升代碼補(bǔ)全、協(xié)作效率等，甚至開始探索 SWE Agent 這樣的新范式。這個(gè)方向本質(zhì)上是面向已有開發(fā)者市場的，屬于一個(gè)存量場景，所以吸引了大量程序員的關(guān)注和使用。

第二類則是增量用戶，主要面向非程序員群體。他們率先服務(wù)的還是posumer，這些人可能不會(huì)寫代碼，但有明確的軟件或應(yīng)用需求，有點(diǎn)像產(chǎn)品經(jīng)理，但是是“打著引號(hào)的產(chǎn)品經(jīng)理”——他們可以用自然語言描述自己的需求，并期望 AI 幫助把這些想法變成一個(gè)原型產(chǎn)品。

目前，AI 模型在前端 UI 生成方面已經(jīng)比較成熟，但真正的軟件工程深水區(qū)，比如后端邏輯、數(shù)據(jù)庫設(shè)計(jì)、高并發(fā)、高可靠性的處理能力等更難的技術(shù)棧，還遠(yuǎn)遠(yuǎn)沒有突破。這正是接下來整個(gè)技術(shù)體系要努力的方向。

所以我們認(rèn)為，AI Coding 一方面是在提升存量程序員的效率，另一方面也在拓展增量市場、實(shí)現(xiàn)開發(fā)能力的“平權(quán)”。最終的目標(biāo)，是讓更多人即使不具備編程能力，也能自由地實(shí)現(xiàn)自己的軟件想法，而不再受限于“程序員供給”的門檻。

AI 科技評(píng)論：聽起來這是兩個(gè)方向——一個(gè)面向程序員的效率提升，一個(gè)面向非程序員的能力擴(kuò)展，確實(shí)可以看作是兩條路徑。那接下來也想請李亞飛老師來聊一聊，特別是 ClackyAI 最近剛發(fā)布了新產(chǎn)品，我們也很期待聽聽你的觀察和看法。

李亞飛：好的，剛才大家聊到了 AI Coding 的定義，我也想從兩個(gè)角度補(bǔ)充一下我的理解。第一，是從軟件工程的復(fù)雜度維度來劃分。我們可以把軟件項(xiàng)目按照工程復(fù)雜程度分成五個(gè)等級(jí)，從 C1 到 C5：

C1：最簡單的項(xiàng)目，比如通過 GPT 聊天生成一個(gè)前端頁面、小工具、小游戲，通常只有一個(gè)文件，純前端邏輯即可。

C2：稍微復(fù)雜一些的小工程，可能包含 10 個(gè)文件以內(nèi)，具備基本樣式和簡單邏輯，比如帶 UI 的小網(wǎng)頁。

C3：像公司官網(wǎng)這樣的項(xiàng)目，結(jié)構(gòu)更完整，文件量可能在 100 個(gè)以內(nèi)，涵蓋完整的前端和部分簡單交互。

C4：真正意義上的軟件工程，具備前端、后端、數(shù)據(jù)庫，業(yè)務(wù)邏輯相對復(fù)雜，通常涉及多個(gè)模塊的協(xié)同。

C5：超級(jí)大工程，比如 Linux、Windows 這類操作系統(tǒng)級(jí)項(xiàng)目，涉及百萬文件、成千上萬名開發(fā)者協(xié)作。

目前我們看到的 AI Coding，大多還停留在 C1 到 C3 的階段。也就是說，它能勝任原型開發(fā)、小工具生成，但距離嚴(yán)肅軟件工程（C4以上）還有一段路要走。

第二個(gè)維度，是 AI Coding 對人類價(jià)值的進(jìn)化階段。我們可以理解為 AI Coding 本身也在經(jīng)歷從「工具」到「合作者」的過程：

第一階段是“輔助補(bǔ)全”階段，AI 能補(bǔ)全代碼、預(yù)測你接下來可能寫的內(nèi)容，就像文章寫作里的自動(dòng)續(xù)寫功能，這一階段已經(jīng)發(fā)展了近兩年。

第二階段是“AI 原生編程”，像 Cursor 這樣的產(chǎn)品代表，基于聊天輔助的編程工具。AI 能圍繞用戶的需求實(shí)現(xiàn)具體模塊、功能，好的就留下來，不好的就可以丟掉。開發(fā)者還是主駕駛員，但 AI 已能提供有價(jià)值的思路和建議，

第三階段是我們現(xiàn)在正進(jìn)入的 “Agentic” 階段，AI agent作為一個(gè)“AI工程師”真正參與到從 0 到 1 的項(xiàng)目建設(shè)中。我們一年前就開始做了，但真正能落地還是在最近一個(gè)月。這是以Claude Code為代表的新型的軟件開發(fā)模式，這種體驗(yàn)非常獨(dú)特：你告訴它一個(gè)目標(biāo)，它會(huì)在后臺(tái)持續(xù)“工作”，幾個(gè)小時(shí)后告訴你“已經(jīng)搞定了”。你去檢查時(shí)會(huì)發(fā)現(xiàn)，大約七成已經(jīng)搭好了，剩下三成搞差了。這個(gè)過程既矛盾又開心。

這一階段，我們認(rèn)為才是真正的 AI 工程師時(shí)代的起點(diǎn)。

終局清晰，路徑仍模糊

AI 科技評(píng)論：有人跟我說，你在舊金山的一個(gè) zip code下面，你能找出來 20 家 AI Coding 的公司，而且每一家切入點(diǎn)都不太一樣，有做 code review，有做 document 的，各種都有，那這個(gè)賽道它有沒有機(jī)會(huì)收斂？很多不同種類的公司的同時(shí)并存，是不是一個(gè)很長期的事情？

李亞飛：我簡單說一下我看到的一些現(xiàn)象?，F(xiàn)在中國這邊其實(shí)還沒那么“熱”，大家應(yīng)該也能感受到，雖然也有一些公司在做，但整體氛圍相對克制。反倒是美國那邊、尤其是硅谷，非?；钴S，因?yàn)槟沁吺擒浖奶焯寐铩?/p>

但也因?yàn)檐浖こ痰膹?fù)雜度很高，它早就形成了非常明確的分工體系。在今天 AI 還處于相對早期階段的情況下，其實(shí)每個(gè)工種理論上都能被賦能。這也是為什么你會(huì)看到市面上有那么多 AI Coding 公司：做 code review 的、做測試的、做需求管理的……整個(gè)軟件開發(fā)流程每個(gè)環(huán)節(jié)都能開出一家公司來。

人類工程師掌握不了那么多的知識(shí)密度，所以需要分工，現(xiàn)在的AI可能在某個(gè)方向不是超級(jí)專家，但是它在大多數(shù)方面都是個(gè)中級(jí)工程師，這個(gè)時(shí)候分工就要發(fā)生變化了。

我覺得現(xiàn)在的趨勢就是從多 Agent 走向單 Agent 架構(gòu)。因?yàn)榉止淼某杀咎?，反而不如一個(gè)大模型“一人多能”來得劃算。有些場景可能不存在了，比如code review 這個(gè)環(huán)節(jié)，都是AI寫的，你還 review 啥？你是在為人類寫代碼做AI，還是在為“AI時(shí)代新的軟件工程”做AI？這里面有本質(zhì)的變化和區(qū)別。現(xiàn)在大家看得也都不太清楚，所以這么多公司百花齊放，大家沖進(jìn)去先干，活下來再說。這是我目前的觀察。

AI 科技評(píng)論：那你覺得，接下來這些基于分工誕生的 AI Coding 公司，會(huì)不會(huì)隨著分工變少、被逐漸取代？未來是不是就不再需要這么多細(xì)分方向了？

李亞飛：可能開始有很多山頭，然后會(huì)進(jìn)入收斂階段，我不覺得會(huì)完全一家獨(dú)大——因?yàn)檐浖こ烫珡?fù)雜了，不太可能被某一個(gè)玩家完全吃掉。更現(xiàn)實(shí)的情況是，會(huì)在幾個(gè)方向、幾個(gè)垂類場景里，各自形成一些穩(wěn)定陣地。這個(gè)行業(yè)用戶的付費(fèi)能力和意愿都很強(qiáng)，市場空間也足夠大，所以哪怕到終局，也不會(huì)是一個(gè)標(biāo)準(zhǔn)答案。

AI 科技評(píng)論：那陳石老師你從投資人的視角怎么看？

陳石：為什么美國有這么多切入點(diǎn)不一樣的公司？我覺得 AI Coding 是當(dāng)前 AI 應(yīng)用落地中最有機(jī)會(huì)的幾個(gè)方向之一。所謂“最有機(jī)會(huì)”，我覺得可以從三個(gè)維度來看：第一，用戶規(guī)模足夠大；第二，模型能力已經(jīng)接近可用水平，至少達(dá)到了能滿足基本使用的程度；第三，市場上已經(jīng)有一部分產(chǎn)品找到了初步的 PMF，比如 Cursor，好像現(xiàn)在已經(jīng)能做到年化 5 億美金的營收了。這三點(diǎn)決定了為什么這個(gè)賽道這么熱、公司這么多。

但與此同時(shí)，我們也看到這個(gè)行業(yè)沒有明顯的收斂趨勢，原因在于很多關(guān)鍵問題還沒有達(dá)成共識(shí)，這一點(diǎn)作為一個(gè)天天見項(xiàng)目的投資人，我感受非常深。

首先是 Copilot 還是 Agent ？未來我傾向于認(rèn)為 Agent 會(huì)更有潛力，但也一定會(huì)存在大量 Copilot 的場景，畢竟熟練的程序員很多時(shí)候還是更喜歡“手搓”。我們原本覺得 Copilot 不太適合創(chuàng)業(yè)公司，但 Cursor 的出現(xiàn)又讓這個(gè)觀點(diǎn)變得不那么確定了。

還有一個(gè)懸而未決的問題是：模型能力的邊界到底在哪？現(xiàn)在看，模型在處理一些垂直方向，比如單元測試、Code Review 這類任務(wù)上表現(xiàn)還不錯(cuò)，端到端地做簡單或中等復(fù)雜度的程序時(shí)也能勝任，但面對真正復(fù)雜的軟件系統(tǒng)、長鏈條的邏輯結(jié)構(gòu)時(shí)還是不行。

同時(shí)還有個(gè)現(xiàn)實(shí)問題是：模型廠商的業(yè)務(wù)邊界在哪里？有些創(chuàng)業(yè)公司會(huì)選擇做 Agent，但他們會(huì)有意避開模型公司可能會(huì)直接做的端到端方案，轉(zhuǎn)向更具壁壘的垂直場景。

Vibe Coding的市場有多大？很多人其實(shí)邏輯思考能力并不強(qiáng)，沒有能力把自己的需求有效地表達(dá)出來，所以這里頭有很多不太確定的東西。

我認(rèn)為， code review 或者單元測試這些 AI Coding的機(jī)會(huì)不太大，因?yàn)樾枨蠛彤a(chǎn)品定義得很清楚了，產(chǎn)品規(guī)范上沒有門檻了。未來的Coding應(yīng)該是每一個(gè)軟件都是定制化的軟件，有機(jī)會(huì)的應(yīng)該是能圍繞垂直行業(yè)和 “深度上下文”展開的Agent，這是模型公司做不了的事情。圍繞著這些垂類行業(yè)的深度上下文，做大量的加工，總結(jié)成良好的提示詞和上下文工程，跟模型做交互，這才是我們創(chuàng)業(yè)公司比較好的發(fā)展機(jī)會(huì)。

AI 科技評(píng)論：宿文老師，您說您希望做一些“用完即焚”的軟件。我覺得這個(gè)思路和剛才陳石老師提到的“定制化軟件”某種程度上是相通的，所以也想請您展開聊聊這個(gè)想法，背后有哪些考慮？

宿文：其實(shí)這個(gè)是我們公司的一個(gè) slogan，上半場是 Auto-coding is AGI，下半場是 Personal App is the End。意思是說，以后每個(gè)人都有屬于自己的 Personal App。這個(gè)APP可以是長期消費(fèi)的，也可以是一次性的軟件。

我們可以先預(yù)測一下終局，如果所有的Coding都是依賴于token去完成的，那可能就會(huì)發(fā)展為模型廠商贏者通吃的局面。走向未來的過程中，其實(shí)每一輪新的工具或技術(shù)出現(xiàn)，首先都是在現(xiàn)有的存量市場中扎根的。畢竟這么多專業(yè)的人才、聰明的大腦，一定會(huì)嘗試擁抱它，把它應(yīng)用到已有的工作場景中。畢竟我們看到整個(gè)軟件世界體量非常龐大，從芯片往上一層一層搭建上來，最終都匯聚在“軟件”這個(gè)抽象層。

有些語料是大模型在后訓(xùn)練（Post-train）或者預(yù)訓(xùn)練（Pre-train）階段見不到的，都是這些垂直領(lǐng)域的玩家在用自己的知識(shí)去做的。這里面的卡點(diǎn)就是，今天的模型應(yīng)該怎么去支持他們？模型架構(gòu)在往前迭代，現(xiàn)在主流模型支持的上下文大概在 120K token 左右，往上做到幾百 K 的已經(jīng)是極限了，Gemini做到Mb級(jí)別的長度了。

我們自己就是從模型層開始干的，我們就發(fā)現(xiàn)很多問題，只要模型迭代下個(gè)月就沒有了，開發(fā)者只要去擁抱新的技術(shù)生態(tài)就好了。

所以對我們來說，在這個(gè)不斷變化的過程中，最關(guān)鍵的是找到一個(gè)落點(diǎn)——我們會(huì)去尋找那些不容易被“堆人”、“堆資源”就能打下來的場景。很多產(chǎn)品和場景，可能按月、按季度就會(huì)被迭代掉。我們思考的也是，既要看清一個(gè)遠(yuǎn)處的終局，也要找到當(dāng)下能活下去的路徑，所以我們也考慮向 C4 這個(gè)環(huán)節(jié)去突破，面向嚴(yán)肅的生產(chǎn)環(huán)境制作軟件。

李亞飛：我想補(bǔ)充問一個(gè)問題，想請教一下宿文。其實(shí)剛才提到的 C4 工程——也就是涉及前端、后端、數(shù)據(jù)庫這些完整鏈路的軟件開發(fā)——它其實(shí)是可以有很多不同的解法的，對吧？比如說，有些人會(huì)選擇無代碼、低代碼的方式來處理，也有一些人堅(jiān)持用標(biāo)準(zhǔn)的技術(shù)棧、按照傳統(tǒng)軟件工程方法來推進(jìn)。那我挺好奇的是，你們在這方面是怎么思考和選擇的？你們更傾向于哪種路徑？

宿文：你肯定觀察到了最近的一些新聞，包括最近被Wix收購的Base44，這個(gè)產(chǎn)品是挺好用的，但是典型地用到了低代碼的手段，很親和于Wix的建站場景，整個(gè)軟件世界肯定不止這些。我們自己的判斷是，原有那套軟件開發(fā)架構(gòu)還是局限于場景之中，是為“人”設(shè)計(jì)的，尤其是為架構(gòu)師、程序員設(shè)計(jì)的，它的核心是：鏈條越長、分工越細(xì)，就越能發(fā)揮規(guī)模協(xié)作的優(yōu)勢。比如一個(gè)大廠有幾千上萬程序員，每個(gè)人都是一個(gè)“螺絲釘”，整個(gè)鏈條組織得非常高效。但大模型來了之后，它的理解和處理方式完全不是這么玩的，我們在做全棧類生成的時(shí)候就非常明顯地感受到這點(diǎn)。

所以我們現(xiàn)在的重點(diǎn)方向是，探索一種面向語言模型親和、以生成為核心的軟件 agent 架構(gòu)。我們認(rèn)為這兩條路徑缺一不可。怎么去理解面向模型的生成式軟件架構(gòu)，這是我們要去摸索的。舉例而言，在面向B端的應(yīng)用中，每個(gè)頁面都會(huì)有一個(gè)搜索組件，但是在生成式的軟件中，整個(gè)架構(gòu)中只有一套搜索的組件，我們再去選擇如何適配各種場景。

我們現(xiàn)在的看到的，比如 Devin 這套架構(gòu)里面，它本質(zhì)上是要替代程序員的，但是又按照程序員的分工協(xié)作去做的技術(shù)鏈條的設(shè)計(jì)，我覺得這樣很怪。我們在嘗試一條新的道路。

李亞飛：明白，這個(gè)問題其實(shí)我們作為創(chuàng)業(yè)者，真的會(huì)有很深的感受。它本質(zhì)上是一種“內(nèi)心的矛盾狀態(tài)”。這個(gè)矛盾來自兩個(gè)方向：一方面，我們知道市場、尤其是投資人這邊，確實(shí)會(huì)有壓力，大家都希望你能盡快跑出 PMF，最好能快速閉環(huán)，用戶開始付費(fèi)，模型也能用起來。

那么從戰(zhàn)術(shù)上講，其實(shí)是有一些作弊的方法的。比如說我就只做個(gè)純前端界面，模型生成完一閉環(huán)，看起來像個(gè)產(chǎn)品，就能收錢了；又比如說我提前把整個(gè)技術(shù)棧鎖定，用低代碼的方式、圍繞某套提示詞和上下文優(yōu)化打磨，也是可以很快搞出東西的。這些辦法都能跑得快、看起來也“成型”了。

但另一方面，作為搞了十多年全棧開發(fā)的工程師，我們心里也非常清楚——這些方式不是終局，甚至說是“偏離正確道路”的妥協(xié)。它們讓團(tuán)隊(duì)進(jìn)入了一個(gè)短暫的“舒適區(qū)”，但那個(gè)方向很可能不是 AI Coding 的未來。所以這時(shí)候你就會(huì)非常矛盾。

到底是堅(jiān)持正確的選擇，還是馬上進(jìn)入快車道去做閉環(huán)，有時(shí)候會(huì)讓團(tuán)隊(duì)陷入一種無所適從的狀態(tài)。剛才聽宿文的回答，我覺得他其實(shí)在那套路徑里，也體現(xiàn)出了一種對這類矛盾的平衡。這個(gè)我挺有共鳴的。

陳石：我這邊想補(bǔ)充一句，其實(shí)亞飛老師剛才說的那種“矛盾”，確實(shí)在市場上是存在的，甚至可以說是目前不少創(chuàng)業(yè)者都會(huì)面對的現(xiàn)實(shí)困境。

就比如現(xiàn)在大家經(jīng)常討論的一個(gè)路徑問題：是不是應(yīng)該先從 Copilot 做起，有了局部的數(shù)據(jù)和經(jīng)驗(yàn)，再泛化到 Agent？但自動(dòng)駕駛行業(yè)又有不同說法，例如有些專業(yè)人士認(rèn)為，L2做得越好，就距離L4越遠(yuǎn)（當(dāng)然很多業(yè)界人士包括我自己并不完全認(rèn)同這個(gè)觀點(diǎn)）。這也引申到 AI Coding 的問題上——你是先專注于一個(gè)垂直場景，做得足夠深，然后再圖泛化？還是說一開始就奔著通用方向去？這兩種路線還沒有形成什么共識(shí)，現(xiàn)在還處于一個(gè)多種探索并存的階段。

李亞飛：今天 Cursor 上個(gè)月改了收費(fèi)方式之后，就被用戶打回原形了，就是這個(gè)矛盾的體現(xiàn)。就是作為 Copilot 產(chǎn)品，現(xiàn)在想按 agent 產(chǎn)品收費(fèi)，用戶不 buy in。這就是一個(gè)矛盾。但如果你第一天就是做的 agent，那你就按這個(gè)方式，比如按任務(wù)規(guī)模復(fù)雜度來收費(fèi)，那就可以了。

陳石：我覺得Cursor的經(jīng)濟(jì)模型可能做不過來了。

李亞飛：我同意。我補(bǔ)充一個(gè)使用體驗(yàn)上的角度。Cursor原來的收費(fèi)方式是，一個(gè)月內(nèi)500次調(diào)用收費(fèi)20美金。這是基于上個(gè)階段的Chat-Base program的產(chǎn)品結(jié)構(gòu)所定義的收費(fèi)方式。但是 Agent 的工作方式是，給它一個(gè)目標(biāo)，它能自己循環(huán)500次。結(jié)果 Agent 花了500次的錢，只收了用戶1次的錢，那Cursor肯定想改。這就是 Agent 模式和 Copilot 模式打架的問題。

“幻覺”仍是模型最大短板

AI 科技評(píng)論：去年一整年，隨著Claude 3.5、3.7的發(fā)布，AI 編程已經(jīng)變得越來越“實(shí)用”了，甚至開始推動(dòng)整個(gè)交互范式往 Agent 模式轉(zhuǎn)變。那問題來了——作為投資人，以及親自參與模型開發(fā)和基于模型做產(chǎn)品的人，你們怎么看當(dāng)前模型能力的瓶頸？

宿文：其實(shí)從我們自己的觀察來看，整個(gè)大模型的能力還遠(yuǎn)遠(yuǎn)沒有達(dá)到理想狀態(tài)，離我們想象中那個(gè)“終點(diǎn)”還差得挺遠(yuǎn)的。但是我們也不能等下一個(gè)版本出現(xiàn)，因?yàn)檎f實(shí)話，你等再久，它也不會(huì)主動(dòng)把你的用戶數(shù)據(jù)納入到 Pre-train 里，所以我們不應(yīng)該做技術(shù)等待型的公司。

Claude 3.5出來，伴隨著一個(gè)很有意思的產(chǎn)品，Artifacts，我們今天就看到了 lovable 這種首先找到一個(gè)變現(xiàn)場景的產(chǎn)品，不管爭議多大，用戶量都有了，前端也能寫的很好。其實(shí)前端語言的邏輯性是很弱的，很多前端代碼都暴露在公網(wǎng)，所以這些都能做出來。但是我們不能拿到數(shù)據(jù)庫，拿到后端代碼。

大模型的問題在于，今天的Transformer架構(gòu)很難把業(yè)務(wù)的長鏈條解決得很好，這是Transformer本身的天花板所決定的，那我們就會(huì)想去解決其中的一部分問題，其中一個(gè)就是“幻覺”。模型為什么產(chǎn)生幻覺？我們后來反復(fù)研究，發(fā)現(xiàn)它的根源其實(shí)還在最早的 Pre-train 階段，特別是反向傳播的機(jī)制本身就有偏差，那我們就看有什么更好的網(wǎng)絡(luò)結(jié)構(gòu)去改造。

所以我們自己的結(jié)論是：如果真的要解決問題，必須從網(wǎng)絡(luò)結(jié)構(gòu)層面去動(dòng)刀，真正讓模型在 Pre-train 階段就變得更靠譜。這才是能帶來陡峭提升的地方。說實(shí)話，從 DeepSeek-V2 發(fā)布到現(xiàn)在，我們看到整個(gè)行業(yè)在這方面的創(chuàng)新還很有限。那我們就自己想辦法解決了。

陳石：剛才宿文老師提到了“幻覺”這個(gè)問題，我也非常認(rèn)同，這是當(dāng)前大模型能力的一個(gè)關(guān)鍵短板。而除了幻覺，另一個(gè)普遍存在的技術(shù)瓶頸，就是上下文窗口的限制。我們現(xiàn)在看到很多代碼庫其實(shí)體量都非常大，很容易就超越了上下文窗口的上限。

此外，受限于當(dāng)前AI模型訓(xùn)練的機(jī)制，模型訓(xùn)練完成后就被凍住了，在運(yùn)行時(shí)一般不再做參數(shù)更新。而每個(gè)用戶在使用模型的時(shí)候，都需要某種程度的定制化，或者說都需要有自己的上下文記憶，現(xiàn)在解決定制化的方法是靠應(yīng)用去存儲(chǔ)和捕捉上下文，以反復(fù)Prompt的方式傳遞給模型。這個(gè)成本很高，且運(yùn)行時(shí)間越長，Prompt長度越大，每一個(gè)交互都需要費(fèi)大量token?，F(xiàn)在雖然像 ChatGPT 引入了一些“記憶功能”，但我覺得還遠(yuǎn)遠(yuǎn)不夠。我認(rèn)為未來模型應(yīng)該可以直接“記住”你的上下文，讓它能像人一樣保有長期記憶，而不是每次都靠 prompt 臨時(shí)加載。

我猜未來會(huì)有一些變化，要么是模型結(jié)構(gòu)上的，允許在運(yùn)行階段動(dòng)態(tài)調(diào)整參數(shù)；要么是解決記憶存儲(chǔ)的安全與隱私問題，比如如何以安全、可控的方式把用戶或企業(yè)的長期上下文交給模型來處理。

AI 科技評(píng)論：亞飛總怎么看待這個(gè)問題呢？

李亞飛：首先我挺佩服真正敢下場做大模型、做 Pre-train 的團(tuán)隊(duì)，今天的大模型確實(shí)還有不少問題和短板需要解決，而我認(rèn)為，在工程領(lǐng)域看待這些問題，可以從兩個(gè)不同的視角入手。

第一個(gè)視角，是智能性，也就是大家經(jīng)常說的“推理能力”。這一塊現(xiàn)在很多模型都在突破，比如陳石總剛才提到的上下文處理問題的兩種思路：一種是直接把盡可能多的上下文“塞”進(jìn)模型中，另一種思路則是像人類那樣通過外部記憶進(jìn)行知識(shí)調(diào)用。實(shí)際上這波 Claude Code 展現(xiàn)了外腦獲取知識(shí)的能力，它會(huì)自己反思看代碼，現(xiàn)在我的測試結(jié)果是，它能把10 萬級(jí)別的文件處理得也很好。

第二個(gè)視角，就是幻覺問題。我覺得這和人類的想象力類似，某種程度上是生成能力的一部分，它可能永遠(yuǎn)無法被完全“消除”。但在 Coding 領(lǐng)域，我們能做的最好的方式是，給模型提供充分的tools，讓模型具備反思能力——也就是要能“犯錯(cuò)-覺察-修正”。

第三個(gè)，我覺得大家經(jīng)常忽略掉的，就是我們要給它一個(gè)更強(qiáng)大的反饋系統(tǒng)。我們從工程領(lǐng)域看到的，比如debug類的信息，沒有給它。原來的debug是單步單點(diǎn)，這是給人類設(shè)計(jì)的。其實(shí)AI不需要單步單點(diǎn)，如果AI研究一會(huì)兒看不出錯(cuò)誤，它就跟你說，請你把調(diào)試器打開把那個(gè)錯(cuò)誤粘給我，然后我才能繼續(xù)。為什么我們不能把這個(gè)信息直接丟給AI呢？這些能力加上之后，AI的能力會(huì)明顯地變強(qiáng)變好。

目前來看，Claude 4.0 的智能性已經(jīng)相當(dāng)強(qiáng)，從今年 6 月開始，真正屬于 Coding 領(lǐng)域的 Agentic 時(shí)刻已經(jīng)到來了。剩下的問題無非就是，Cli是不是最好的形態(tài)了。

原型做得快，生產(chǎn)還得慢慢來

AI 科技評(píng)論：要想提升AI的編程能力，哪些東西是模型能做的？哪些是產(chǎn)品設(shè)計(jì)中能做的？

宿文：在我看來，這兩方面還比較難拆開。模型迭代得很快，我們核心還是構(gòu)建數(shù)據(jù)飛輪。產(chǎn)品層面來看，工程也是很重要的一件事情。我們的模型和產(chǎn)品缺乏一個(gè)超級(jí)動(dòng)態(tài)規(guī)劃，其實(shí)大家今天都靜態(tài)得不能再靜態(tài)了。

那模型層要做什么呢？我覺得最核心的還是數(shù)據(jù)飛輪的構(gòu)建。之前美國紅杉開會(huì)的時(shí)候，幾乎沒有一家公司的CEO能說清楚怎么構(gòu)建的。我們認(rèn)為，真正有效的數(shù)據(jù)飛輪一定從 Pre-train 階段開始。但 Pre-train 成本極高，不可能頻繁跑。所以關(guān)鍵在于怎么通過網(wǎng)絡(luò)結(jié)構(gòu)創(chuàng)新來支持“增量預(yù)訓(xùn)練”，而不是傳統(tǒng)意義上的增量微調(diào)（Post-train），從而讓token的權(quán)重可以快速地進(jìn)行動(dòng)態(tài)調(diào)整。這肯定是網(wǎng)絡(luò)結(jié)構(gòu)決定的，我們今天基本上能夠做到了。

然后你再看上下文的處理問題。去年的上下文窗口競爭，一度“卷”到兆級(jí)上下文。但那其實(shí)更多是post-train層面的改造，不是真正從 Pre-train 層解決上下文編碼能力的問題。比如去年 Magic.dev 的探索就很有代表性，他們認(rèn)為編程的卡點(diǎn)在大上下文，于是基于mamba的架構(gòu)去做了，雖然過程不順，但思路非常有價(jià)值?；旌霞軜?gòu)加上位置編碼的方式，能不能把上下文擴(kuò)展到Mb級(jí)別？我覺得是可以的，那我們就這樣做了。

而從產(chǎn)品層面，我們關(guān)注的重點(diǎn)是用戶的真實(shí)表達(dá)能力。你的用戶可以是程序員，也可以是非程序員，甚至是完全不懂技術(shù)的“普通用戶”。關(guān)鍵在于你能否讓他們把自己的需求講清楚。而這恰恰是今天對話式交互里最大的挑戰(zhàn)。我們肯定去做社區(qū)，做內(nèi)容沉淀讓更多的知識(shí)可復(fù)用；還有就是擺脫對話式，做圖形的交互方式等等。產(chǎn)品考慮的是用戶入口的事，模型考慮的是智能迭代的事。

AI 科技評(píng)論：明白。陳石總，從您作為投資人看過這么多產(chǎn)品的這個(gè)角度來看，您覺得呢？

陳石：我之前也做過技術(shù)和 CTO，雖然現(xiàn)在離技術(shù)有些遠(yuǎn)了，但對這個(gè)話題還是有一些感受。AI Coding 想要在未來真正發(fā)展起來，我認(rèn)為核心在于“兩端能力”的協(xié)同推進(jìn)：

一端是模型側(cè)能力的持續(xù)進(jìn)化，包括更強(qiáng)的邏輯推理、對上下文的理解與處理能力、以及上下文窗口的進(jìn)一步擴(kuò)展等等。這是模型層面的事。另一端則是應(yīng)用層的“上下文工程”。也就是說，產(chǎn)品要通過巧妙的設(shè)計(jì)和人機(jī)交互方式，幫助用戶清晰、完整地表達(dá)出他們的上下文和需求。

模型和應(yīng)用端面臨的挑戰(zhàn)就是，如何幫助那些邏輯表達(dá)不夠清晰的用戶，把他們真實(shí)的心理需求，以清晰的方式用自然語言的方式表達(dá)出來。

AI 科技評(píng)論：大多數(shù)基于 LLM 的編碼助手 AI Coding 的產(chǎn)品并不公開其內(nèi)部邏輯，所以我們很難去驗(yàn)證它生成代碼的準(zhǔn)確性，也不能夠去理解它為什么會(huì)做出來這樣的輸出，就沒有辦法去嵌入到真實(shí)的這個(gè)項(xiàng)目環(huán)境，但是Vibe Coding這個(gè)詞又很熱，所以我們應(yīng)該怎么去看待它的價(jià)值？

陳石：對于早期的嘗試性用戶，如果有一些編程基礎(chǔ)，他們可能覺得比較好。我們要認(rèn)識(shí)到Vibe Coding還是一個(gè)原型驗(yàn)證的階段，偏向于把創(chuàng)意激發(fā)出來。

有些人可以告訴AI，你給我寫個(gè)貪吃蛇游戲，它就寫出來了。因?yàn)檫@是一個(gè)很容易的代碼。如果是一個(gè)復(fù)雜的東西，受限于人類的自然語言表達(dá)能力，和當(dāng)前的語言模型的編程能力，還是比較難的。所以不要把快速做出貪吃蛇當(dāng)回事，這只是個(gè)很簡單的功能，甚至不需要大語言模型。

我們的訴求是，產(chǎn)品側(cè)幫助用戶把真實(shí)需求以規(guī)范的產(chǎn)品文檔方式表達(dá)出來，以及在模型側(cè)怎么形成好的軟件工程范式，這兩段的努力能夠讓Vibe Coding產(chǎn)生更大的價(jià)值。

AI 科技評(píng)論：宿文總好像對貪吃蛇這種游戲類可以說幾句。

宿文：游戲是個(gè)非常復(fù)雜的事情。今天大家看到 AI 做馬里奧、貪吃蛇這些案例，確實(shí)能跑通，更多是因?yàn)檫@些場景早已有很多類似樣本，模型能“見多識(shí)廣”，所以比較容易實(shí)現(xiàn)。

我不太喜歡Vibe Coding 這個(gè)詞，但是今天到底能做到哪一步？目前典型產(chǎn)品，比如lovable、bolt.new 甚至更早一些的工具，確實(shí)已經(jīng)能做到做出原型，而原型這件事在很多場景下本身就已經(jīng)很有價(jià)值了。它能夠幫助開發(fā)者省去大量方案設(shè)計(jì)、產(chǎn)品需求撰寫和原型構(gòu)建的工作，所以才會(huì)有那么大的用戶量。

我們更關(guān)注的是下一步：如何進(jìn)入真正的生產(chǎn)環(huán)境，并贏得用戶信任。過去由人來寫代碼，哪怕出錯(cuò)也能溯源、有人背鍋。但今天基于大語言模型的代碼生成，本質(zhì)上是概率模型，天然帶有不確定性。如何讓用戶信任這種“不確定性里的生產(chǎn)力”？這需要分階段、分角度來推進(jìn)。以前只有少數(shù)程序員能夠做的高階工程，以后也會(huì)以token的形式交付出來，這樣一步一步驗(yàn)證它的安全性，慢慢影響用戶心智，從而進(jìn)入生產(chǎn)環(huán)境。

到底要不要放開源代碼，我們持相對開放的態(tài)度，有一個(gè)問題是，一旦放開，用戶再一改代碼，整個(gè)deploy環(huán)境就亂套了，也就破壞完整的數(shù)據(jù)閉環(huán)了。

AI 科技評(píng)論：為什么不喜歡Vibe Coding這個(gè)詞？

宿文：國內(nèi)最主流的翻譯是氛圍編程，這感覺不是一個(gè)能進(jìn)生產(chǎn)環(huán)境的詞。

李亞飛：有一個(gè)詞更合適，叫松弛編程，就是我心情比較輕松，氛圍編程就好像是在玩，瞎搞。

今天我們對此有兩個(gè)矛盾。第一個(gè)矛盾是：來自業(yè)務(wù)側(cè)的“小白用戶”，他們很多都是非常專業(yè)的商業(yè)人士，只是完全不懂編程。但他們有明確的需求，想自己動(dòng)手做一個(gè)應(yīng)用。然而現(xiàn)實(shí)是，哪怕今天的工具已經(jīng)進(jìn)步了很多，這種需求和能力之間還是沒有完全拉齊。所以 Vibe coding 才會(huì)在某些圈子里被嫌棄——因?yàn)樗o了用戶“好像能搞定一切”的錯(cuò)覺。

第二類矛盾是：專業(yè)工程師的認(rèn)知正在迅速分化。我最近觀察到一個(gè)有趣的現(xiàn)象：本來就是“十倍效率”的高階工程師，在接入“松弛編程”之后，效率能再提升十倍，甚至達(dá)到百倍。普通的工程師，只要用對方法，也能獲得顯著提升。還有一些工程師是堅(jiān)決反對甚至排斥的。但這并不代表他們錯(cuò)了——可能只是因?yàn)檫€沒真正看到這些工具的威力。我自己就反復(fù)橫跳了兩次，但是它一次次改變了我的想法。

我們現(xiàn)在早就不是貪吃蛇可以一鍵生成的時(shí)代，Vibe Coding已經(jīng)可以做到 one-shot 生成一個(gè)完整的官網(wǎng)頁面，甚至借助它做點(diǎn)外包項(xiàng)目。今天的一些工程師已經(jīng)可以通過松弛變成搞定 C3、C4 復(fù)雜度的項(xiàng)目，包括后臺(tái)、數(shù)據(jù)庫等全套系統(tǒng)。

這類能力距離“完全小白用戶”使用還有一段距離，當(dāng)然，也可能未來永遠(yuǎn)不會(huì)出現(xiàn)“完全小白用戶”能獨(dú)立做工程的那一天。畢竟軟件開發(fā)本質(zhì)上是軟硬工程結(jié)合的復(fù)雜工作——懂行的人都知道它有多難。但有一點(diǎn)是可以肯定的：未來的開發(fā)過程一定是“松弛的”，以后的工程師都是業(yè)務(wù)邏輯式的，技術(shù)水平只需要以前的三分之一，但是他們能捋清商業(yè)邏輯，捋清產(chǎn)品邏輯。

如果你本身就掌握了編程技能，在 Vibe Coding 這個(gè)浪潮里，你依然能夠做到比別人高出十倍的效率。

AI 科技評(píng)論：以后Vibe Coding會(huì)公開代碼嗎？

李亞飛：我的答案是應(yīng)該公開。它的本質(zhì)還是代碼，還是資產(chǎn)，誰都能來接管。自動(dòng)駕駛的汽車司機(jī)也能接管，只是沒必要。

“倒車式”創(chuàng)新

AI 科技評(píng)論：正好也銜接我們接下來的話題。現(xiàn)在大家都在討論：為什么Claude Code能在這么短的時(shí)間里積累起這么大的聲量，獲得這么多用戶的轉(zhuǎn)化？是、因?yàn)樗茿nthropic的產(chǎn)品？還是說它在產(chǎn)品形態(tài)或能力上真做出了重大突破？

李亞飛：我的體感可能會(huì)更強(qiáng)一些。我覺得它在形態(tài)上是“開了倒車”的——它回到了 30 年前命令行程序那一套，甚至可以說是 GUI 出現(xiàn)之前、60 年代那種技術(shù)形態(tài)。產(chǎn)品定義上是倒車的，但是程序員是相對能接受的。

它之所以爆火，關(guān)鍵在于它非常充分地激發(fā)了 Claude 4.0 的智能能力。它幾乎不需要很長的上下文，也不依賴太多的人類提示或“補(bǔ)丁”，就能產(chǎn)生足夠好的智能性。所以我覺得這是一個(gè)真正的 Agentic 工具。

基模在ChatGPT3.5那個(gè)時(shí)代，它只能做補(bǔ)全，而且還只是一些小文件，所以只能做Copilot，后來到了Claude 3.5，大家發(fā)現(xiàn)我們能跟AI有一些基本的對話了，可以做出一些功能性的能力了，現(xiàn)在到了Agent的階段，但是AI也沒強(qiáng)到那種程度，只能算是初中級(jí)工程師。

我認(rèn)為 CLI 最終不是未來，未來一定是云端、多工協(xié)作的模式。Agent就像是一個(gè)工程師，以后雇一個(gè)工程師不滿意的話，就雇三個(gè)、五個(gè)，多開多干。

AI 科技評(píng)論：我覺得“倒退”也未必是壞事。宿文老師，您怎么看？

宿文：這個(gè)問題可能亞飛總更專業(yè)一些，因?yàn)槲易约弘x開寫代碼已經(jīng)挺久了，嚴(yán)格來說我既不是Claude Code也不是 Cursor 的典型用戶。

從我們內(nèi)部的觀察來看，真正的源頭，還是看誰掌握模型。lovable也好、Cursor也好，一定程度上都是Claude的token的二道販子。特別是在這樣一個(gè)早期且劇烈變化的階段，握有底層模型能力的一方必然占據(jù)更多主動(dòng)權(quán)。我認(rèn)為歸根結(jié)底，今天還是誰握著模型、誰的主動(dòng)性就更強(qiáng)。

AI 科技評(píng)論：陳石總以前做過CTO，您怎么看Claude Code？

陳石：我覺得Claude Code 之所有受到好評(píng)，主要原因首先是它的上下文工程做得好，畢竟沒有人比模型廠商更知道如何全面、有效率地向模型提供它完成任務(wù)需要的Prompt。其次是Claude Code剛好有些取巧，它當(dāng)前只提供命令行界面（CLI），愿意且有能力使用CLI來編程的人大部分是有經(jīng)驗(yàn)的程序員，而這批人更有能力取得好的體驗(yàn)。

據(jù)Anthropic公司的統(tǒng)計(jì)，Claude Code上80%的左右使用的是Agent功能，而Cursor上只有50%，這也是CLI界面上編程序的特點(diǎn)，它相對于圖形界面（GUI）是不友好的，做深度復(fù)雜的編程是很難的，程序員要在這么多文件上來來回回切來切去也很麻煩，所以大家更愿意去用Claude Code的Agent功能，這也讓它有了更大的聲量。

李亞飛：對一些老程序員來說，Cli做開發(fā)比較快。

陳石：還有我覺得前端還是有很多價(jià)值的，否則Google也不會(huì)發(fā)那么多錢去收購windsurf，這可能也是我們應(yīng)用創(chuàng)業(yè)的一個(gè)機(jī)會(huì)吧。

AI 科技評(píng)論：我下一個(gè)問題就想請陳石總先談?wù)劇狝gent 未來有沒有可能成為研發(fā)流程里的核心 Controller 或 Planner？從您目前的觀察來看，這個(gè)路徑是否已經(jīng)成為業(yè)界的共識(shí)？

陳石：從趨勢上來看，確實(shí)有越來越多創(chuàng)業(yè)公司涌向 Agent 路線。Copilot 這個(gè)方向現(xiàn)在難度太高了，海外大廠都在做，比如微軟的GitHub Copilot ，此外Cursor這些領(lǐng)先的創(chuàng)業(yè)公司也做得不錯(cuò)。你再去從頭做一個(gè) Copilot，幾乎沒有多少空間了。所以很多人選擇了 Agent 這條路線。

Agent 作為 Controller 和 Planner，雖然當(dāng)前取得一些進(jìn)步，但是現(xiàn)在還談不上成熟。你讓它去做一個(gè)深度的任務(wù)規(guī)劃，或者真的做一個(gè)“項(xiàng)目經(jīng)理”角色，其實(shí)還是非常困難的。何況讓它寫對邏輯性和一致性要求非常高的代碼，稍微復(fù)雜一點(diǎn)可能連編譯都通不過。

雖然 Agent 的方向是對的，但要走通它還面臨很多挑戰(zhàn)。未來模型能力會(huì)提升，這是肯定的；但在這個(gè)過程中，我們必須有一套流程設(shè)計(jì)，讓人類能夠參與其中，承擔(dān)監(jiān)督和反饋的角色。哪怕是做標(biāo)注、做獎(jiǎng)勵(lì)反饋，只要能把人類嵌進(jìn) Agent 的工作流中，Agent 的表現(xiàn)就會(huì)更好。

現(xiàn)在最大的問題是，Agent 做完一整套操作之后，大部分情況要么完全跑不通，要不跑通但不符合用戶需求，且普遍存在用戶反饋滯后稀疏的情況。這種反饋結(jié)果非常不利于模型做強(qiáng)化學(xué)習(xí)。所以關(guān)鍵還是流程設(shè)計(jì)：要讓人類愿意提供高質(zhì)量的反饋，讓模型在過程中就能獲得獎(jiǎng)勵(lì)信號(hào)，這樣才能真正訓(xùn)練出一個(gè)好用的 Agent。

AI 科技評(píng)論：亞飛總您怎么看？現(xiàn)在做 Agent 是不是已經(jīng)成為行業(yè)共識(shí)？

李亞飛：我覺得“成為共識(shí)”可能還言之尚早。我今天最大的任務(wù)，就是想告訴大家——Agent 應(yīng)用，尤其是在 Coding 領(lǐng)域，已經(jīng)可以用了。

現(xiàn)在很多人還是將信將疑的。其實(shí)那么多大廠、那么多團(tuán)隊(duì)，就像微軟早早地做了 Copilot，結(jié)果看著Cursor做了起來，我覺得其實(shí)是大廠內(nèi)部沒有那么篤信。

你看中國的大廠，還在搞IDE呢，Cursor都被彎道超車一個(gè)月了。有些大廠還希望你把模型私有化進(jìn)去，做Copilot。

宿文：我們從第一天就認(rèn)為，Agent肯定是未來，但是就怕它不是這一波泡沫中應(yīng)該出現(xiàn)的事兒呢。

我覺得Coding Agent在這一波技術(shù)周期還是能落地很多場景的，但是現(xiàn)在仍然是完全不成熟的狀態(tài)。我們自己內(nèi)部討論的時(shí)候，有人說超級(jí)動(dòng)態(tài)planning，要讓產(chǎn)品很靈活，效果又都有保障，結(jié)果我們發(fā)現(xiàn)，底層的給Agent做的infra是完全不完善的。我們期待會(huì)有一些更好的Agent框架，如果出現(xiàn)了，我們就快速地?fù)肀?，同時(shí)我們自己也在做一些突破。目前來看還是有瓶頸的。

AI 科技評(píng)論：那你們有哪些嘗試呢？

宿文：我們目前最核心的探索，其實(shí)還是聚焦在“如何更靈活地滿足用戶的個(gè)性化需求”上。因?yàn)槿绻阋峁┮粋€(gè)端到端的方案，首先是你整個(gè)技術(shù)棧得非常完整，其次是要面對用戶非常長尾分散的需求。

現(xiàn)在不管是Manus還是Devin提出的一些東西，我們都不太能夠借鑒得上，我們先一步步地做自己的生成式軟件agent架構(gòu)，未來留待擁抱更多的靈活性。

AI 科技評(píng)論：確實(shí)，agent 的能力和未來的落地還存在很多挑戰(zhàn)。請陳石總從更宏觀的角度聊聊，您怎么看待 AI Coding Agent 生態(tài)的發(fā)展？

陳石：我覺得可以抽象為兩個(gè)關(guān)鍵方向：第一，是基礎(chǔ)設(shè)施層面的統(tǒng)一，尤其是要為 agent 或 AI 特別設(shè)計(jì)的一整套基礎(chǔ)設(shè)施；第二，是協(xié)作與監(jiān)督工具的完善，讓人類和 AI 能更高效地協(xié)作，同時(shí)對 AI 有一定可控性。

比如 OpenAI 的 CodeX、Claude Code 模塊等，都會(huì)配套一些沙盒環(huán)境。這類“安全可控”的運(yùn)行環(huán)境非常關(guān)鍵，因?yàn)樽詈玫尿?yàn)證方式，其實(shí)就是讓 Agent 在虛擬環(huán)境先跑一遍，這類基礎(chǔ)設(shè)施非常重要。我覺得這一類產(chǎn)品會(huì)慢慢成為一個(gè)既安全又能形成標(biāo)準(zhǔn)的一個(gè)運(yùn)行環(huán)境。還有就是用戶端的長期記憶和上下文共享的機(jī)制，包括MCP、一些向量數(shù)據(jù)庫等等。

再說協(xié)作監(jiān)督工具。如何讓一個(gè)邏輯能力弱一點(diǎn)的用戶，也能把需求準(zhǔn)確表達(dá)出來？這個(gè)過程需要一整套引導(dǎo)機(jī)制。

還有一個(gè)特別重要但現(xiàn)在缺失的東西是可視化調(diào)試工具?，F(xiàn)在的大模型像個(gè)黑盒，用戶不知道它為啥出錯(cuò)、哪里錯(cuò)了，就跟自動(dòng)駕駛的 corner case 一樣，你沒有辦法預(yù)警，也很難修復(fù)。如果能有像儀表盤那樣的可視化系統(tǒng)，讓人可以在高層級(jí)上看清 AI 的“決策路徑”，那人就能更有效地“標(biāo)注” agent 的行為，形成一個(gè)更健康的閉環(huán)反饋系統(tǒng)。

所以總結(jié)來說，基礎(chǔ)設(shè)施統(tǒng)一和協(xié)作監(jiān)督機(jī)制，是 agent 生態(tài)目前最需要補(bǔ)足的兩大塊。

AI 科技評(píng)論：那這些工作應(yīng)該主要由誰來做？是 Agent 開發(fā)者、平臺(tái)方，還是說這其實(shí)是很適合創(chuàng)業(yè)團(tuán)隊(duì)切入的機(jī)會(huì)？

陳石：關(guān)鍵是判斷哪些模塊是適合做在應(yīng)用層的，哪些模塊適合在模型層做。像我們投資的做一體化 Agent 工作環(huán)境的產(chǎn)品，就是一個(gè)創(chuàng)業(yè)團(tuán)隊(duì)在做。你可以從 Infra 層切入，也可以從應(yīng)用層往下扎。比如 Cursor 本身做了很多前端上的交互設(shè)計(jì)，它也在做一些記憶機(jī)制、上下文優(yōu)化，還有數(shù)據(jù)收集與回溯能力，這些也都在增強(qiáng) Agent 的協(xié)作能力。所以說這些事，應(yīng)用開發(fā)者和平臺(tái)方其實(shí)都可以做。

AI 科技評(píng)論：宿文總，您在市場上有看有接觸過這樣的公司，或者是有這些需求嗎？

宿文：我們從 2023 年底決定切入這個(gè)領(lǐng)域開始，就特別關(guān)注，在未來的研發(fā)與商業(yè)化過程中，會(huì)存在哪些“生態(tài)型卡點(diǎn)”會(huì)讓這種不確定性非常高，所以前期規(guī)劃的時(shí)候我們盡可能把能規(guī)避的都規(guī)避了。

我們看到的比較大的，我們嘗試解決，也希望產(chǎn)業(yè)鏈的小伙伴能共同解決的一個(gè)難點(diǎn)就是，生成式數(shù)據(jù)庫。因?yàn)槲覀兘裉熳龅拇蠖鄶?shù)場景，仍然集中在 CRUD 類型的系統(tǒng)開發(fā)上，而這個(gè)場景上最重要的就是數(shù)據(jù)庫。

我們今天做的還是相對簡單的獨(dú)立系統(tǒng)，但是人類至少積累了三四十年的數(shù)據(jù)資產(chǎn)，大量企業(yè)從 90 年代就開始使用 ERP 系統(tǒng)，里頭積累了三四十年的合規(guī)數(shù)據(jù)、進(jìn)銷存數(shù)據(jù)，后面一代代的系統(tǒng)都是在這個(gè)系統(tǒng)上去做增量開發(fā)，或者疊加的。那么大模型時(shí)代生成的內(nèi)容跟歷史內(nèi)容之間的交互關(guān)系在哪兒？這是我們認(rèn)為在端到端這件事情上比較大的卡點(diǎn)。

李亞飛：大家今天聊到了很深的場景話題。我們相信“端到端生成”就是未來，在AI能力不斷變強(qiáng)的情況下，端對端的核心邏輯就兩個(gè)：第一，是一個(gè)真正的Agent在工作。未來一定不是 prompt based 的一次性交互，而是一個(gè)智能體，真正作為開發(fā)者參與到項(xiàng)目全流程中。第二，今天人類在架構(gòu)設(shè)計(jì)、系統(tǒng)認(rèn)知上的優(yōu)勢仍然遠(yuǎn)超 AI，所以我們就應(yīng)該把這些難點(diǎn)提前替 AI 處理好，給它創(chuàng)造一個(gè)“可控的工作空間”。

哪些難點(diǎn)呢？宿文剛才說的數(shù)據(jù)庫是一個(gè)，還有就是框架選型，根據(jù)需求匹配最合適的語言架構(gòu)。我們幫助Agent把這個(gè)運(yùn)行環(huán)境給準(zhǔn)備好，對于非專業(yè)工程師來說，這就是Agent的工作區(qū)。萬事俱備，我們最終才能塑造一個(gè)真正意義上的端對端APP的交付。

先提效，再提質(zhì)

AI 科技評(píng)論：那下一個(gè)問題是一個(gè)現(xiàn)實(shí)但可能略顯“悲觀”的議題：我們現(xiàn)在看到 AI 在生成代碼的過程中，會(huì)大量制造“垃圾代碼”，因?yàn)槌杀咎停瑢?dǎo)致很多大廠的代碼庫越來越龐雜、難以維護(hù)。這是一個(gè)真的需要擔(dān)心的問題，還是只是個(gè)“杞人憂天”？

李亞飛：這個(gè)問題絕對是現(xiàn)實(shí)存在的，而且已經(jīng)非常廣泛。因?yàn)榻裉靋ode寫起來實(shí)在太容易了，大模型傾向于寫點(diǎn)code去幫你解決問題，我就親眼見過，它寫了一個(gè)不work，它順手在下面又寫了一個(gè)，最后一塊交給我了。

解決這個(gè)問題的思路并不復(fù)雜，人類是有版本管理的，代碼推送之后是要確認(rèn)的，如果你是一個(gè)比AI更好的工程師，你就在確認(rèn)環(huán)節(jié)把它這些不太好的方案干掉。

其他的解決思路還有，在 prompt 設(shè)計(jì)和上下文設(shè)計(jì)里面要充分地讓 AI 知道不要瞎寫東西，盡可能多約束AI，隨時(shí)打斷。

宿文：我們其實(shí)完全沒擔(dān)心過“生成垃圾代碼”這件事。這種現(xiàn)象在歷史上都出現(xiàn)過。比如在知識(shí)傳播這件事上，從古代口耳相傳到現(xiàn)代信息爆炸的時(shí)代，我們也沒擔(dān)心過這個(gè)事兒。

當(dāng)然，這個(gè)類比未必完全貼切。但如果我們要精準(zhǔn)地回答這個(gè)問題，其實(shí)很簡單：你不進(jìn)生產(chǎn)環(huán)境，代碼再臟也是工程師的事情。至于工程師在這個(gè)過程中如何轉(zhuǎn)變角色、如何管理質(zhì)量，那是另一個(gè)話題。

所以，我們完全不會(huì)擔(dān)心這會(huì)影響到軟件的實(shí)際使用者。這個(gè)問題是可以解決的，而且應(yīng)該在提升效率之后再回頭解決質(zhì)量問題。就像生成式數(shù)據(jù)庫的問題，我們會(huì)基于存量的各種各樣的數(shù)據(jù)庫構(gòu)建今天的系統(tǒng)，但是我們知道未來新的IT架構(gòu)會(huì)倒逼新的 Infra 產(chǎn)生。

同樣的一個(gè)字段，在不同的軟件開發(fā)廠商的數(shù)據(jù)中可能明明完全不一樣，那就需要后端程序員通過API等業(yè)務(wù)理解去做的。大模型去跨系統(tǒng)去理解這個(gè)事情是很難的，一定要做語義貼合，不然成本太高，所以我們只能停留在上一代的數(shù)據(jù)庫形態(tài)上。但是人類有個(gè)特點(diǎn)，只要倒逼到那一步，大概率也有聰明腦袋能解決。

陳石：我也同意大家的看法。這個(gè)問題是存在的，但不需要過度焦慮。放眼整個(gè)互聯(lián)網(wǎng)，我們已經(jīng)充滿了“垃圾數(shù)據(jù)”了，但并沒有因此停滯。更重要的是，代碼和文本不同，它具有結(jié)構(gòu)性、邏輯性和可驗(yàn)證性——你寫得好不好，其實(shí)能跑一遍測試就知道了。

在編程世界里，有很多方法論可以幫助我們做代碼質(zhì)量篩選，比如 lint 工具、單元測試、代碼審查等等。更重要的是，AI 現(xiàn)在也能調(diào)用這些工具自動(dòng)檢測代碼。我相信有朝一日，AI 寫出的代碼質(zhì)量會(huì)超過大部分普通程序員。

李亞飛：大家為什么會(huì)關(guān)心這個(gè)問題呢？我覺得本質(zhì)上，軟件是一種負(fù)債，生產(chǎn)出來的軟件，你就得維護(hù)它，你不維護(hù)它就像一個(gè)生命一樣就要死掉了。如果你寫出來剛剛好能work的代碼，沒有及時(shí)消除你的債務(wù)的話，它就指向了一種持續(xù)維護(hù)的成本，這就有個(gè)隱形的雷。

軟件工程里面這個(gè)問題還是比較嚴(yán)重的，必須要消除掉。我們不能說這一代程序員寫出來就不管了，等下一代程序員來了接手這個(gè)“屎坑”。

陳石：這個(gè)問題最終的解決不在于代碼上，有可能就在于你的prompt提煉出來的產(chǎn)品規(guī)范上。如果產(chǎn)品規(guī)范定義得足夠優(yōu)質(zhì)，下一次你換個(gè)架構(gòu)或換種編程語言去重寫一遍代碼問題也不大了。

李亞飛：站在產(chǎn)品角度，我們把它叫做產(chǎn)品架構(gòu)，站在技術(shù)角度，我們把它叫做技術(shù)架構(gòu)，這是兩位一體的東西，也是一個(gè)好產(chǎn)品的核心骨架。只要骨架還在，外圍的代碼爛一點(diǎn)關(guān)系不大。

好的技術(shù)，是需求的釋放

AI 科技評(píng)論：最后一個(gè)問題，我們今天討論了很多 AI Coding 的進(jìn)展。那放眼未來，它可能會(huì)徹底改變?nèi)祟惻c代碼的交互方式。你們認(rèn)為程序員的工作會(huì)發(fā)生什么樣的變化？映射一下我們今天的主題，AI 顛覆的第一個(gè)職業(yè)，會(huì)是程序員嗎？

宿文：好的技術(shù)一定是通過創(chuàng)造供給的方式，激發(fā)出更多需求。當(dāng)然，第一階段一定是服務(wù)于“已有程序員”的——讓他們用得更爽、更高效，尤其在一些高度垂直、封閉的場景，比如半導(dǎo)體領(lǐng)域的 firmware 這套軟件的開發(fā)，這不可能是大模型能做的事情，反而是這些程序員可以利用好 AI，工作質(zhì)量可能更上一層樓。所以會(huì)有很多垂類場景長期存在。

但在另一些場景中，程序員的角色可能真的會(huì)被“再定義”。比如很多行業(yè)其實(shí)需要的只是把業(yè)務(wù)需求“翻譯”為軟件，但因?yàn)楣┙o的效率、供給的成本、供給的質(zhì)量等等限制，這個(gè)需求長期被壓抑?，F(xiàn)在有了 AI，門檻降低了，大量非技術(shù)用戶就能用 token 去完成代碼生成，觸發(fā)出新的增量市場。這些也是我們的商業(yè)模式的范圍。

既然以后所有的代碼是依賴于token實(shí)現(xiàn)的，那就把它變成infra，變成infra的時(shí)候，Coding的收費(fèi)邏輯也會(huì)發(fā)生改變的。這些是5年之內(nèi)可以預(yù)期到的事情。

AI 科技評(píng)論：那亞飛總，您是程序員出身，肯定感受更深。

李亞飛：是，我本身就是工程師出身，所以體會(huì)確實(shí)很直接。我覺得可以用一句話總結(jié)：打孔的人不需要了，但懂打孔機(jī)原理的人仍然有價(jià)值。早期的程序員其實(shí)就是在打孔、輸入程序，那種工種確實(shí)消失了。

沒有AI干得好的人，確實(shí)不需要了。但好消息是——懂底層原理的人，在新的體系中會(huì)更加值錢。他們會(huì)成為“維護(hù)打孔機(jī)的人”，會(huì)更快地適應(yīng)新范式。同時(shí)，這也意味著新工種的誕生。這是一個(gè)新的工作機(jī)會(huì)，因?yàn)樯a(chǎn)軟件變得更便宜了，個(gè)性化軟件需求時(shí)代會(huì)到來。新時(shí)代生產(chǎn)軟件的人，我姑且稱之為“業(yè)務(wù)邏輯師”。

陳石：未來發(fā)展的瓶頸就變成了人和AI結(jié)構(gòu)化的溝通。今天程序員真正寫代碼的時(shí)間，其實(shí)只占工作量的 20%-30%，大多數(shù)時(shí)間花在溝通、邏輯整理和系統(tǒng)設(shè)計(jì)上。如果模型越來越強(qiáng)，它不僅能寫出高質(zhì)量代碼，甚至可以自動(dòng)挑選最合適的語言、架構(gòu)和實(shí)現(xiàn)方式。那時(shí)候，真正的“源代碼”可能是你在AI幫助下寫出來的產(chǎn)品規(guī)范文檔。

這份“文檔”可以是自然語言、流程圖、界面草圖的組合，它的結(jié)構(gòu)清晰度越高，AI 實(shí)現(xiàn)的準(zhǔn)確性就越好。而未來的 IDE，也許不再是代碼編輯器，而是一個(gè)“集成思維澄清器”——幫你厘清思路、表達(dá)邏輯、形成規(guī)范，剩下的都交給 AI。

到那時(shí)，程序員的核心能力，可能不是寫代碼，而是能不能清晰表達(dá)需求、構(gòu)建邏輯架構(gòu)。這也印證了剛才亞飛總說的“業(yè)務(wù)邏輯師”這個(gè)概念——甚至我覺得一些邏輯性強(qiáng)的職業(yè)，比如律師，都可能在這個(gè)新工種中如魚得水。

AI 科技評(píng)論：三位的回答其實(shí)都不約而同地指向一個(gè)趨勢：未來的程序員，也許不是“代碼工匠”，而是“業(yè)務(wù)翻譯者”和“需求架構(gòu)師”。寫代碼這件事，逐漸被抽象掉，真正有價(jià)值的，是結(jié)構(gòu)化表達(dá)與邏輯構(gòu)建的能力。

至于“AI 顛覆的第一個(gè)職業(yè)是不是程序員”——可能不是簡單的“被替代”，而是徹底的“角色轉(zhuǎn)變”。

非常感謝宿文老師、陳石老師、李亞飛老師，今天的分享非常深入且富有啟發(fā)。這次圓桌分享到這里就正式結(jié)束了，謝謝大家！雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。