代碼生成三問：如何打造 24 小時(shí)在線的 AI 程序員？

本文作者：張進(jìn)

2024-08-28 10:22

導(dǎo)語：Copilot 是過程，Agent 才是通往成功的方向。

「雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))」2024 年年初，擁有編程全棧技能的 Devin 驚艷全球，讓外界看到了 AI 改變一個(gè)行業(yè)——替代程序員的可能性。

Devin 發(fā)布數(shù)周后，其背后的公司 Cognition 也隨即獲得 1.75 億美元融資，估值從 3.5 億美元一躍升至 20 億美元。緊接著，4 月，一家 AI 編碼輔助創(chuàng)業(yè)公司 Augment 宣布完成 2.52 億美元的融資，投后估值接近獨(dú)角獸，代碼生成賽道的多米諾骨牌效應(yīng)開始出現(xiàn)……

到上半年，硅谷代碼生成類的公司估值起步價(jià)已經(jīng)高達(dá) 2 億美金，頭部公司甚至 20 億美金。而據(jù)一位行業(yè)人士分析，代碼生成的概念之所以受到追捧，其中一個(gè)重要原因是“人類的數(shù)據(jù)不夠用了”。

AGI 時(shí)代的一個(gè)重要組成是人類必須依靠機(jī)器生成的數(shù)據(jù)，而代碼生成的數(shù)據(jù)被部分從業(yè)者認(rèn)為是“人類通往 AGI 過程中最有邏輯性與嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)”。

與此同時(shí)，網(wǎng)絡(luò)上為大模型代碼生成提效歡呼的聲音越來越多。例如，一位中國開發(fā)者就提出，Claude 3.5 Sonnet 只要 500+ 行的 html 就能實(shí)現(xiàn)一個(gè)不錯(cuò)的功能；還有開發(fā)者稱，其借助 GPT-4o 輔助代碼寫作，以前開發(fā)小程序需要一個(gè)月，現(xiàn)在只需要七天……

根據(jù)開發(fā)者的反饋，大模型的代碼生成能力正在真切地提升每位開發(fā)者的工作效率。

事實(shí)上，程序員對(duì)于“AI 代碼生成”的想象早有年頭。在這波生成式 AI 浪潮之前，市場(chǎng)上就已出現(xiàn)一系列的 AI 編程工具，例如 Tabnine、Kite 等，但受限于它們的技術(shù)路徑，過去的產(chǎn)品對(duì)于上下文邏輯的理解和代碼生成的質(zhì)量不盡人意。

清流資本合伙人劉博告訴 AI 科技評(píng)論，AI 編碼工具的其中一個(gè)效果評(píng)估指標(biāo)是代碼文件中由模型生成的代碼占比，上一代工具只能做到 10-20%，而新一代的 AI 編程工具最高可以做到 40-50%——這是質(zhì)的飛躍，同時(shí)新一代工具對(duì)編程上下文的理解也顯著更好。

微軟 CEO 稱，兩年前上線的 AI 編程工具 GitHub Copilot（后接入 GPT-4 模型后更名為“Copilot X”）已經(jīng)開始獲利、并擁有 180 萬付費(fèi)訂閱用戶。

迄今大模型狂飆一年半，在所有基于大模型的新 AI 工具中，coding 場(chǎng)景的 PMF 和付費(fèi)意愿最先被驗(yàn)證，GitHub Copilot 僅用 14 個(gè)月便達(dá)到了 1 億美元 ARR，是歷史上增長(zhǎng)最快的 SaaS 產(chǎn)品——這與其他場(chǎng)景里曇花一現(xiàn)的 AI 產(chǎn)品形成鮮明對(duì)比。

幾乎所有的通用大模型公司都推出了代碼大模型和 AI 編程助手，如 OpenAI codex、Meta Code Llama、智譜 CodeGeeX、百度的 comate、騰訊云的 AI 代碼助手、DeepSeek Coder……

國內(nèi)創(chuàng)業(yè)公司也開始增多：一站式 DevOps 研發(fā)管理平臺(tái) Coding 創(chuàng)始人張海龍創(chuàng)立了 AI Agent 公司 Babel，企業(yè)智能化軟件開發(fā)解決方案提供商 aiXcoder 也因此受到資本關(guān)注、并在2023年迅速完成了 A+ 輪融資。

多方勢(shì)力角逐，創(chuàng)業(yè)公司在混亂中爭(zhēng)取生機(jī)，而創(chuàng)業(yè)公司、通用大模型公司、科技大廠各方仍然面臨 AI 領(lǐng)域發(fā)展的通用問題：To C 還是To B，技術(shù)路徑選擇通用大模型還是垂直模型，要不要自研模型，以及如何在 GitHub Copilot 的籠罩下突圍。

值得注意的是，受限于底層技術(shù)大模型的能力，目前各種 AI 編程產(chǎn)品仍然集中于 coding 階段，在代碼補(bǔ)全和代碼生成兩個(gè)場(chǎng)景 PK，所以本質(zhì)上，現(xiàn)在的 AI 編程產(chǎn)品依然是 AI coding。

但盡管如此，“24 小時(shí) AI 程序員”的生產(chǎn)力仍然讓所有人著迷。

1
為什么對(duì) coding 情有獨(dú)鐘？

當(dāng)前大多數(shù) AI coding 產(chǎn)品主攻代碼補(bǔ)全和代碼生成兩個(gè)高頻場(chǎng)景。

軟件開發(fā)的智能化最開始就是從代碼生成和代碼補(bǔ)全開始的。因?yàn)榧夹g(shù)容易實(shí)現(xiàn)，不會(huì)顛覆程序員的開發(fā)模型，代碼補(bǔ)全是整個(gè)行業(yè)做的比較成熟的功能，不管是大廠還是初創(chuàng)公司，產(chǎn)品都能用起來，且正確率較高。

在一個(gè)已有的項(xiàng)目中根據(jù)上下文去增加新功能叫代碼補(bǔ)全，即開發(fā)者用自然語言表達(dá)一個(gè)需求，用代碼生成。代碼生成現(xiàn)在正處于從文件級(jí)代碼到項(xiàng)目級(jí)代碼的突破。

代碼生成還處于初級(jí)階段，簡(jiǎn)單的函數(shù)能生成得比較好，但并不是完全靠大模型，需要外掛一些知識(shí)庫配合，不能達(dá)到100%準(zhǔn)確，若再想擴(kuò)展到一個(gè)文件級(jí)的代碼生成，難度則會(huì)增高，往倉級(jí)別的難度會(huì)更高，而 Devin 展示的就是往倉級(jí)別去實(shí)現(xiàn)。

一位研究代碼智能的專家告訴 AI 科技評(píng)論，代碼補(bǔ)全現(xiàn)在是兵家必爭(zhēng)之地，是已經(jīng)真正落地、也是程序員使用最多的場(chǎng)景。相對(duì)來說，代碼生成功能的使用頻率相對(duì)少一些，目前要真正融入到日常的開發(fā)成為高頻選項(xiàng)還有一些距離，原因是代碼生成需要改變程序員的開發(fā)模式、開發(fā)習(xí)慣。代碼生成目前依然是通過跟一個(gè)對(duì)話機(jī)器人對(duì)話，用自然語言表達(dá)需求來讓大模型生成一段代碼，在這個(gè)過程中不斷交互、表達(dá)需求，需求表達(dá)地越清晰、生成的代碼越準(zhǔn)確。這過程中涉及到需求拆解。將一個(gè)大的需求拆解成一個(gè)個(gè)的小任務(wù)，再去生成，需求拆解對(duì)于當(dāng)前大模型來說還有難度。同時(shí)，由于編程思維跟自然語言表達(dá)是兩回事，對(duì)于開發(fā)者來說，一個(gè)人代碼寫的好，并不意味著用自然語言表達(dá)業(yè)務(wù)邏輯好，它需要具備兩方面的能力。一是要熟悉業(yè)務(wù)，二是要扎實(shí)的計(jì)算機(jī)理論知識(shí)，包括算法，操作系統(tǒng)，軟件工程，計(jì)算機(jī)安全等，這其實(shí)對(duì)開發(fā)者的個(gè)人素養(yǎng)提出了很高的要求。

除了代碼補(bǔ)全和代碼生成兩個(gè)高頻場(chǎng)景，其他產(chǎn)品尋求差異化的出口是提供代碼注釋、代碼解讀、代碼 bug 修復(fù)、代碼優(yōu)化、漏洞檢測(cè)等能力。

例如國內(nèi)智譜 CodeGeeX 便開發(fā)了獨(dú)有的功能，例如去年年底推出的工具箱，就是基于模型具備Code Interpreter代碼解釋器能力，可以批量處理多種格式的文件、批量實(shí)現(xiàn)數(shù)據(jù)可視化、繪制數(shù)學(xué)函數(shù)圖等。

CodeGeeX 負(fù)責(zé)人鄭勤鍇認(rèn)為，在這些事情上為開發(fā)者節(jié)省了時(shí)間，開發(fā)者就能將工作更多放在頂層設(shè)計(jì)上——怎么把代碼的架構(gòu)設(shè)計(jì)地更好、功能考慮地更完善，從而提高軟件的質(zhì)量。

智譜在2022年就完成了CodeGeeX代碼大模型的訓(xùn)練，并同時(shí)推出了 CodeGeeX插件產(chǎn)品。

跟GitHub Copilot 一樣，CodeGeeX定位是智能輔助編程，但輔助也分為不同層級(jí)，目前已經(jīng)從單個(gè)文件輔助拓展到了項(xiàng)目級(jí)輔助編程，因?yàn)閷?shí)際開發(fā)場(chǎng)景中不可能只有單文件，大多都是多文件。

CodeGeeX負(fù)責(zé)人鄭勤鍇稱，往項(xiàng)目級(jí)拓展的挑戰(zhàn)在于項(xiàng)目生成的成功率，因?yàn)榇a項(xiàng)目往往不只是一小段代碼或者一個(gè)文件的代碼組成，而是同時(shí)需要完成項(xiàng)目中跨文件的代碼理解和生成補(bǔ)全。讓模型能充分理解更長(zhǎng)的信息，并提取到關(guān)鍵部分，這對(duì)模型的要求很高。

對(duì)于參數(shù)量10B以下的代碼大模型，從海量的代碼中準(zhǔn)確提取信息是一個(gè)關(guān)鍵性的挑戰(zhàn)。CodeGeeX4支持128K上下文，能夠處理和利用更長(zhǎng)代碼文件、包括項(xiàng)目代碼中的信息，是模型更深入理解復(fù)雜和細(xì)節(jié)豐富的代碼的關(guān)鍵點(diǎn)。

2
如何跟 GitHub Copilot 競(jìng)爭(zhēng)？

一位投資人認(rèn)為，做 AI 編程助手沒人能拼得過 GitHub Copilot。

GitHub Copilot 主要 To C，面向個(gè)人開發(fā)者定價(jià)每月 10 美元（約 66.9 元人民幣）或每年 100 美元（約 669 元人民幣）。

To B 企業(yè)用戶月費(fèi) 39 美元，企業(yè)用戶可以將代碼部署到云端，而不必在本地反復(fù)克??；企業(yè)用戶可以內(nèi)建知識(shí)庫，形成個(gè)性化的Copilot Chat（在原有Copilot的基礎(chǔ)之上，開發(fā)者可以直接用自然語言和Copilot對(duì)話來解決遇到的問題），甚至是對(duì)底層模型進(jìn)行微調(diào)。

除了占據(jù)時(shí)間上的先發(fā)優(yōu)勢(shì)，GitHub Copilot 擁有兩大先天優(yōu)勢(shì)，一是背靠擁有上億開發(fā)者的代碼托管平臺(tái) GitHub，二是底層接入的是 OpenAI 最強(qiáng)的模型。

站在今天來看，微軟對(duì)開發(fā)者市場(chǎng)的戰(zhàn)略一直很清晰：2015 年推出跨平臺(tái)代碼編輯器 VScode，從用戶側(cè)統(tǒng)一IDE；2018 年收購 GitHub，擁有大量代碼數(shù)據(jù)（包括商用的未公開的數(shù)據(jù)）；2019 年，微軟向 OpenAI 投資了 10 億美金，并獲得了 OpenAI 技術(shù)的商業(yè)化授權(quán)。

于是，在 2020 年 OpenAI 推出了 GPT-3 后，拿著最多的代碼數(shù)據(jù)去訓(xùn)練模型，隔年 AI 編程工具 GitHub Copilot被推出，成為全球最早一款大模型 AI 編程工具，搶占了先發(fā)優(yōu)勢(shì)。

今年 4 月微軟 CEO 稱 GitHub Copilot 已經(jīng)擁有 180 萬付費(fèi)訂閱用戶。

但也有多位從業(yè)者認(rèn)為 GitHub Copilot 并非能一統(tǒng)天下。

“對(duì)于國內(nèi)市場(chǎng)而言，商業(yè)化機(jī)會(huì)在 B 端?！鼻辶髻Y本合伙人劉博告訴 AI 科技評(píng)論。

首先，AI 編程產(chǎn)品面向的中大型企業(yè) B 端市場(chǎng)大概是幾十億人民幣的規(guī)模，用戶付費(fèi)意愿非常明確，這一市場(chǎng)規(guī)模和客單價(jià)在軟件服務(wù)市場(chǎng)上已經(jīng)比較客觀。

對(duì)于國內(nèi) B 端用戶而言，他們有兩個(gè)需求是 GitHub Copilot 無法滿足的：1）模型本地部署，如果云端調(diào)用 GitHub Copilot 會(huì)有代碼泄露的風(fēng)險(xiǎn)同時(shí)本地部署后可以根據(jù)客戶的私有代碼進(jìn)一步訓(xùn)練，顯著提升代碼生成的效果；2）大客戶需要選擇國內(nèi)的產(chǎn)品作為供應(yīng)商，避免數(shù)據(jù)外流。

照著以上標(biāo)準(zhǔn)來找標(biāo)的，清流資本在去年 9 月參與了國內(nèi)面向企業(yè)的智能化軟件開發(fā)解決方案提供商 aiXcoder A+ 輪投資。跟 GitHub copilot 不同，aiXcoder 聚焦 To B，為企業(yè)提供基于代碼大模型的智能化軟件開發(fā)解決方案，包含私有化部署、企業(yè)領(lǐng)域知識(shí)與大模型融合、定制化開發(fā)等服務(wù)。清流資本合伙人劉博告訴 AI 科技評(píng)論，B 端市場(chǎng)的打法是當(dāng)公司在一個(gè)行業(yè)里已經(jīng)滲透了足夠多的客戶后，就能成為 AI Coding工具實(shí)質(zhì)上的行業(yè)標(biāo)準(zhǔn)，成為行業(yè)里其他企業(yè)采購 AI Coding 工具時(shí)必須邀請(qǐng)參與競(jìng)標(biāo)的供應(yīng)商。因此從國內(nèi)的商業(yè)化角度出發(fā)，先發(fā)優(yōu)勢(shì)和聚焦很重要。aiXcoder孵化自北京大學(xué)軟件工程研究所，在2013年就開始研究深度學(xué)習(xí)跟代碼結(jié)合，早在 2022 年 6 月便發(fā)布了中國首個(gè)百億級(jí)參數(shù)的代碼大模型 aiXcoder-13B，能夠支持方法級(jí)（函數(shù)級(jí)）的代碼補(bǔ)全。aiXcoder COO 李力行認(rèn)為，代碼大模型落地時(shí)，如何跟企業(yè)的領(lǐng)域知識(shí)或者私域知識(shí)相結(jié)合非常關(guān)鍵，從而保證生成的代碼更準(zhǔn)確，因?yàn)榇a生成要用到很多上下文信息，以及一些外部的領(lǐng)域知識(shí)，領(lǐng)域知識(shí)是指企業(yè)的業(yè)務(wù)邏輯、業(yè)務(wù)知識(shí)等等。一位資深從業(yè)者認(rèn)為，高質(zhì)量的數(shù)據(jù)才是模型能力的區(qū)隔。公開的數(shù)據(jù)可能有一天終會(huì)達(dá)到瓶頸，但世界上還有大量的私有數(shù)據(jù)可能永遠(yuǎn)不會(huì)被公開，它們存在于各個(gè) B 端企業(yè)內(nèi)部，與企業(yè)業(yè)務(wù)邏輯強(qiáng)耦合。aiXcoder 在為客戶做本地部署的時(shí)候會(huì)基于這些私有化數(shù)據(jù)進(jìn)行再訓(xùn)練，給每個(gè)企業(yè)打造專屬的代碼大模型。

3
通用大模型還是垂直模型？

GitHub Copilot 占據(jù)了 C 端優(yōu)勢(shì)地位，國內(nèi)玩家不約而同選擇了 C 端免費(fèi)策略，如智譜 CodeGeeX、百度Comate、騰訊云 AI 代碼助手都推出了面向個(gè)人開發(fā)者的免費(fèi)工具，這幾家廠商跟 aiXcoder 一樣、將商業(yè)化看向 B 端。

它們共同的思路是拿代碼數(shù)據(jù)在各自的基座大模型上進(jìn)行預(yù)訓(xùn)練或者微調(diào)，相同的代碼數(shù)據(jù)來自GitHub和其他可公開訪問的源代碼，百度、阿里、騰訊這些大廠還有一部分內(nèi)部代碼的積累。

收集數(shù)據(jù)的方式、選取數(shù)據(jù)的類型、訓(xùn)練的方法……整個(gè)訓(xùn)練過程多個(gè)環(huán)節(jié)的差異導(dǎo)致各個(gè)代碼模型效果各異。

例如智譜 CodeGeeX 推出一體機(jī)的模式，開箱即用，提供完善的軟硬件和使用方式，特點(diǎn)是可以結(jié)合企業(yè)內(nèi)部的代碼倉庫、知識(shí)庫來加強(qiáng)代碼能力，優(yōu)勢(shì)是代碼是私有化安全的。

企業(yè)更關(guān)注怎么跟企業(yè)內(nèi)部的代碼、數(shù)據(jù)文檔做結(jié)合，在模型訓(xùn)練階段對(duì)這些代碼并不了解，包括企業(yè)內(nèi)部自己定義的 API 接口等等。

為了讓模型更懂企業(yè)的代碼，CodeGeeX 提供了幾個(gè)方向：定制化的微調(diào)方案，在企業(yè)內(nèi)部去用它們自己的代碼去對(duì)模型進(jìn)行強(qiáng)化，還包括 RAG 檢索增強(qiáng)方案，即把企業(yè)代碼和文檔作為知識(shí)庫來輔助預(yù)測(cè)。

有投資人并不看好創(chuàng)業(yè)公司做代碼大模型，他們認(rèn)為 AI Coding 這塊未來依然是通用大模型公司的事情，大模型公司更擅長(zhǎng)做這件事，創(chuàng)業(yè)公司很難產(chǎn)生差異化，而且競(jìng)爭(zhēng)對(duì)手太多了。

而且，軟件 To B 一直面臨的問題是國內(nèi) B 端客戶用不起，這是國內(nèi) SaaS 一直沒做起來的原因之一。

的確，根據(jù)開發(fā)者的反饋，如 GPT-4o、Claude 3.5 Sonnet 這樣的通用大模型現(xiàn)在也能保持不錯(cuò)的代碼效果。

一位從業(yè)者認(rèn)為，未來可能會(huì)有一個(gè)在所有模態(tài)上都很強(qiáng)的六邊形戰(zhàn)士模型，但真正從B端商業(yè)化落地來看，不太有太多公司有能力本地部署這樣一個(gè)參數(shù)量巨大的六邊形戰(zhàn)士模型，市場(chǎng)仍然需要一個(gè)代碼垂直模型。

那么創(chuàng)業(yè)公司如何跟大廠競(jìng)爭(zhēng)？

大廠在理論上可以做所有的事情，但：

首先，大廠需要在所有能做的事情里去選擇以及決定對(duì)應(yīng)的資源調(diào)配，對(duì)于大廠而言，有太多方向可以得到比單個(gè) B 端 coding 場(chǎng)景更多的資源，比如通用大模型、AGI 等，而創(chuàng)業(yè)公司 100% 聚焦在一件事上；

其次，在垂直場(chǎng)景里，大廠的認(rèn)知不一定比創(chuàng)業(yè)公司更深。B 端 AI coding是一個(gè)非常垂直且專業(yè)的場(chǎng)景，在大模型的基礎(chǔ)上仍然需要大量進(jìn)階的代碼 knowhow 和對(duì)客戶需求的深度洞察。

aiXcoder COO李力行認(rèn)為，首先需要通過全流程的數(shù)據(jù)治理和個(gè)性化訓(xùn)練，使大模型能夠深刻理解并掌握企業(yè)領(lǐng)域知識(shí)，落地企業(yè)專屬代碼大模型；隨后，利用多 agent 等方式結(jié)合傳統(tǒng)軟件開發(fā)工具和方法，高效地解決企業(yè)復(fù)雜的軟件開發(fā)任務(wù)。

4
Agent 是趨勢(shì)

軟件開發(fā)是一個(gè)復(fù)雜的系統(tǒng)工程，coding只占其中很少的部分，還涉及到需求理解、debugging、優(yōu)化、部署等多個(gè)環(huán)節(jié)。而以 GitHub Copilot 為首的 AI 編程輔助產(chǎn)品現(xiàn)在只能寫點(diǎn)“函數(shù)磚頭”，砌墻的事還得程序員親自來。

但 Devin 的出現(xiàn)滿足了外界對(duì) AI 軟件開發(fā)的想象力，不止于 coding 階段。

在 3 月初創(chuàng)公司 Cognition 的 demo 演示中，Devin 化身為一個(gè)擁有“全棧技能”的AI程序員，一個(gè)能夠獨(dú)立完成任務(wù)的自助系統(tǒng)，在快速原型設(shè)計(jì)、修復(fù)bug和復(fù)雜數(shù)據(jù)的可視化上表現(xiàn)優(yōu)秀。

從交互上，Devin 帶來了一種新的AI軟件開發(fā)形態(tài)，包括命令行、瀏覽器等組件，是第一個(gè)脫離 IDE 的軟件開發(fā)形態(tài)。從實(shí)際任務(wù)上，Devin 愿景是完成整個(gè)軟件開發(fā)的需求任務(wù)，這種能完成更復(fù)雜開發(fā)任務(wù)的 Agent 已經(jīng)成為業(yè)內(nèi)確定的產(chǎn)品趨勢(shì)。

而 Devin 則被稱為 Agent 的“ChatGPT 時(shí)刻”。

一位 AI Agent 創(chuàng)業(yè)者趙聰認(rèn)為，issue level 的 coding 都需要用 Agent 來實(shí)現(xiàn)，解決的是更復(fù)雜的問題，自動(dòng)解 issue。issue 等同于文件級(jí)的代碼，而現(xiàn)在的代碼生成、補(bǔ)全都是在單文件上，解 issue 往往是針對(duì)整個(gè)項(xiàng)目，擁有多個(gè)文件。

aiXcoder COO 李力行看好 Agent 在軟件開發(fā)領(lǐng)域的應(yīng)用，他認(rèn)為多 Agent 協(xié)作也讓全流程代碼生成等更加復(fù)雜的開發(fā)任務(wù)成為可能。在2024年， aiXcoder 推出基于Agent技術(shù)的智能化軟件開發(fā)系統(tǒng)2.0，通過大模型+軟件開發(fā)工具調(diào)用解決企業(yè)項(xiàng)目級(jí)代碼生成問題，確保復(fù)雜開發(fā)場(chǎng)景下代碼生成的高效性、準(zhǔn)確性和可靠性。

Devin 想要去解決一個(gè)問題，或者說修改一個(gè)倉密度的代碼，大家都在朝著 Devin 的方向做探索，但大模型能力現(xiàn)在幾乎還達(dá)不到。目前 Agent 還處于探索、實(shí)驗(yàn)階段。

距離 Devin 發(fā)布已經(jīng)過去五個(gè)月，依然沒有任何更進(jìn)一步的消息。其 CEO Scott 也透露，他們尚無明確的公開預(yù)覽（public preview）時(shí)間表，目前仍在內(nèi)測(cè)階段，即無確定的產(chǎn)品形態(tài)。

CodeGeeX 負(fù)責(zé)人鄭勤鍇則認(rèn)為，Agent 只是實(shí)現(xiàn)某個(gè)功能的路徑，現(xiàn)在的 Agent 很多只是簡(jiǎn)單的工具調(diào)用。重要的還是看最終實(shí)現(xiàn)的功能，能達(dá)到多高的可用性。

趙聰認(rèn)為未來的創(chuàng)業(yè)機(jī)會(huì)在 AI Agent，因?yàn)?AI 編程賽道上 Copilot 微軟已經(jīng)做了，很難再與之競(jìng)爭(zhēng)，所以只能往前走，即直接替代人。開發(fā)者平時(shí)很多工作都類似于拿著螺絲刀擰螺絲，Copilot 就是把螺絲刀換成了電鉆，而 AI 程序員則是給開發(fā)者配個(gè)小弟，所以 Copilot 依然是個(gè)好工具，但 AI 程序員就是生產(chǎn)力，這是完全不同的兩件事。

但做 AI 程序員不是科學(xué)問題，而是個(gè)工程問題。這里涉及路徑選擇的問題，在做 AI 程序員時(shí)有公司是自己做模型，趙聰認(rèn)為這是錯(cuò)誤的路徑，他不相信所謂的小模型/垂直模型，覺得模型就只有大模型，因?yàn)橹挥写竽Ｐ湍軒碇橇Α?/p>

未來面臨的挑戰(zhàn)是，所有人都要往 project level coding 走，要依賴底層模型的進(jìn)化，但模型太貴。趙聰認(rèn)為GPT-4 至少得再降價(jià) 10 倍，才具有真正的可能性。

在軟件工程中，AI 難以解決的兩大問題是：1）復(fù)雜項(xiàng)目的業(yè)務(wù)上下文理解。2）每家公司獨(dú)特的工程架構(gòu)、邏輯和實(shí)踐。在解決這兩個(gè)問題之前，AI Agent 還無法完全替代人類程序員。

但多位從業(yè)者一致認(rèn)為，隨著 AI 不斷進(jìn)化，未來高級(jí)程序員不會(huì)被替代，擰螺絲的初級(jí)程序員被替代已經(jīng)能看到，未來程序員的培養(yǎng)路徑也跟現(xiàn)在不一樣，就像高科技種地，不需要真的從種地開始學(xué)，而是先從學(xué)習(xí)使用工具開始。

未來 C 端應(yīng)該更好地服務(wù)普通人，而不僅僅是開發(fā)者，如果普通人也能通過 AI 實(shí)現(xiàn)編程，那么 C 端有可能完成一次爆發(fā)，而這需要更強(qiáng)的模型能力，端到端仍然需要 Agent 來實(shí)現(xiàn)。

但可以肯定的是，未來程序員逐漸都會(huì)離不開 AI 編程工具。「雷峰網(wǎng)」

（文中趙聰為化名）

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。