0
本文作者: 張進(jìn) | 2024-08-28 10:22 |
「雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))」2024 年年初,擁有編程全棧技能的 Devin 驚艷全球,讓外界看到了 AI 改變一個(gè)行業(yè)——替代程序員的可能性。
Devin 發(fā)布數(shù)周后,其背后的公司 Cognition 也隨即獲得 1.75 億美元融資,估值從 3.5 億美元一躍升至 20 億美元。緊接著,4 月,一家 AI 編碼輔助創(chuàng)業(yè)公司 Augment 宣布完成 2.52 億美元的融資,投后估值接近獨(dú)角獸,代碼生成賽道的多米諾骨牌效應(yīng)開始出現(xiàn)……
到上半年,硅谷代碼生成類的公司估值起步價(jià)已經(jīng)高達(dá) 2 億美金,頭部公司甚至 20 億美金。而據(jù)一位行業(yè)人士分析,代碼生成的概念之所以受到追捧,其中一個(gè)重要原因是“人類的數(shù)據(jù)不夠用了”。
AGI 時(shí)代的一個(gè)重要組成是人類必須依靠機(jī)器生成的數(shù)據(jù),而代碼生成的數(shù)據(jù)被部分從業(yè)者認(rèn)為是“人類通往 AGI 過(guò)程中最有邏輯性與嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)”。
與此同時(shí),網(wǎng)絡(luò)上為大模型代碼生成提效歡呼的聲音越來(lái)越多。例如,一位中國(guó)開發(fā)者就提出,Claude 3.5 Sonnet 只要 500+ 行的 html 就能實(shí)現(xiàn)一個(gè)不錯(cuò)的功能;還有開發(fā)者稱,其借助 GPT-4o 輔助代碼寫作,以前開發(fā)小程序需要一個(gè)月,現(xiàn)在只需要七天……
根據(jù)開發(fā)者的反饋,大模型的代碼生成能力正在真切地提升每位開發(fā)者的工作效率。
事實(shí)上,程序員對(duì)于“AI 代碼生成”的想象早有年頭。在這波生成式 AI 浪潮之前,市場(chǎng)上就已出現(xiàn)一系列的 AI 編程工具,例如 Tabnine、Kite 等,但受限于它們的技術(shù)路徑,過(guò)去的產(chǎn)品對(duì)于上下文邏輯的理解和代碼生成的質(zhì)量不盡人意。
清流資本合伙人劉博告訴 AI 科技評(píng)論,AI 編碼工具的其中一個(gè)效果評(píng)估指標(biāo)是代碼文件中由模型生成的代碼占比,上一代工具只能做到 10-20%,而新一代的 AI 編程工具最高可以做到 40-50%——這是質(zhì)的飛躍,同時(shí)新一代工具對(duì)編程上下文的理解也顯著更好。
微軟 CEO 稱,兩年前上線的 AI 編程工具 GitHub Copilot(后接入 GPT-4 模型后更名為“Copilot X”)已經(jīng)開始獲利、并擁有 180 萬(wàn)付費(fèi)訂閱用戶。
迄今大模型狂飆一年半,在所有基于大模型的新 AI 工具中,coding 場(chǎng)景的 PMF 和付費(fèi)意愿最先被驗(yàn)證,GitHub Copilot 僅用 14 個(gè)月便達(dá)到了 1 億美元 ARR,是歷史上增長(zhǎng)最快的 SaaS 產(chǎn)品——這與其他場(chǎng)景里曇花一現(xiàn)的 AI 產(chǎn)品形成鮮明對(duì)比。
幾乎所有的通用大模型公司都推出了代碼大模型和 AI 編程助手,如 OpenAI codex、Meta Code Llama、智譜 CodeGeeX、百度的 comate、騰訊云的 AI 代碼助手、DeepSeek Coder……
國(guó)內(nèi)創(chuàng)業(yè)公司也開始增多:一站式 DevOps 研發(fā)管理平臺(tái) Coding 創(chuàng)始人張海龍創(chuàng)立了 AI Agent 公司 Babel,企業(yè)智能化軟件開發(fā)解決方案提供商 aiXcoder 也因此受到資本關(guān)注、并在2023年迅速完成了 A+ 輪融資。
多方勢(shì)力角逐,創(chuàng)業(yè)公司在混亂中爭(zhēng)取生機(jī),而創(chuàng)業(yè)公司、通用大模型公司、科技大廠各方仍然面臨 AI 領(lǐng)域發(fā)展的通用問(wèn)題:To C 還是To B,技術(shù)路徑選擇通用大模型還是垂直模型,要不要自研模型,以及如何在 GitHub Copilot 的籠罩下突圍。
值得注意的是,受限于底層技術(shù)大模型的能力,目前各種 AI 編程產(chǎn)品仍然集中于 coding 階段,在代碼補(bǔ)全和代碼生成兩個(gè)場(chǎng)景 PK,所以本質(zhì)上,現(xiàn)在的 AI 編程產(chǎn)品依然是 AI coding。
但盡管如此,“24 小時(shí) AI 程序員”的生產(chǎn)力仍然讓所有人著迷。
當(dāng)前大多數(shù) AI coding 產(chǎn)品主攻代碼補(bǔ)全和代碼生成兩個(gè)高頻場(chǎng)景。
軟件開發(fā)的智能化最開始就是從代碼生成和代碼補(bǔ)全開始的。因?yàn)榧夹g(shù)容易實(shí)現(xiàn),不會(huì)顛覆程序員的開發(fā)模型,代碼補(bǔ)全是整個(gè)行業(yè)做的比較成熟的功能,不管是大廠還是初創(chuàng)公司,產(chǎn)品都能用起來(lái),且正確率較高。
在一個(gè)已有的項(xiàng)目中根據(jù)上下文去增加新功能叫代碼補(bǔ)全,即開發(fā)者用自然語(yǔ)言表達(dá)一個(gè)需求,用代碼生成。代碼生成現(xiàn)在正處于從文件級(jí)代碼到項(xiàng)目級(jí)代碼的突破。
代碼生成還處于初級(jí)階段,簡(jiǎn)單的函數(shù)能生成得比較好,但并不是完全靠大模型,需要外掛一些知識(shí)庫(kù)配合,不能達(dá)到100%準(zhǔn)確,若再想擴(kuò)展到一個(gè)文件級(jí)的代碼生成,難度則會(huì)增高,往倉(cāng)級(jí)別的難度會(huì)更高,而 Devin 展示的就是往倉(cāng)級(jí)別去實(shí)現(xiàn)。
一位研究代碼智能的專家告訴 AI 科技評(píng)論,代碼補(bǔ)全現(xiàn)在是兵家必爭(zhēng)之地,是已經(jīng)真正落地、也是程序員使用最多的場(chǎng)景。相對(duì)來(lái)說(shuō),代碼生成功能的使用頻率相對(duì)少一些,目前要真正融入到日常的開發(fā)成為高頻選項(xiàng)還有一些距離,原因是代碼生成需要改變程序員的開發(fā)模式、開發(fā)習(xí)慣。代碼生成目前依然是通過(guò)跟一個(gè)對(duì)話機(jī)器人對(duì)話,用自然語(yǔ)言表達(dá)需求來(lái)讓大模型生成一段代碼,在這個(gè)過(guò)程中不斷交互、表達(dá)需求,需求表達(dá)地越清晰、生成的代碼越準(zhǔn)確。這過(guò)程中涉及到需求拆解。將一個(gè)大的需求拆解成一個(gè)個(gè)的小任務(wù),再去生成,需求拆解對(duì)于當(dāng)前大模型來(lái)說(shuō)還有難度。同時(shí),由于編程思維跟自然語(yǔ)言表達(dá)是兩回事,對(duì)于開發(fā)者來(lái)說(shuō),一個(gè)人代碼寫的好,并不意味著用自然語(yǔ)言表達(dá)業(yè)務(wù)邏輯好,它需要具備兩方面的能力。一是要熟悉業(yè)務(wù),二是要扎實(shí)的計(jì)算機(jī)理論知識(shí),包括算法,操作系統(tǒng),軟件工程,計(jì)算機(jī)安全等,這其實(shí)對(duì)開發(fā)者的個(gè)人素養(yǎng)提出了很高的要求。
除了代碼補(bǔ)全和代碼生成兩個(gè)高頻場(chǎng)景,其他產(chǎn)品尋求差異化的出口是提供代碼注釋、代碼解讀、代碼 bug 修復(fù)、代碼優(yōu)化、漏洞檢測(cè)等能力。
例如國(guó)內(nèi)智譜 CodeGeeX 便開發(fā)了獨(dú)有的功能,例如去年年底推出的工具箱,就是基于模型具備Code Interpreter代碼解釋器能力,可以批量處理多種格式的文件、批量實(shí)現(xiàn)數(shù)據(jù)可視化、繪制數(shù)學(xué)函數(shù)圖等。
CodeGeeX 負(fù)責(zé)人鄭勤鍇認(rèn)為,在這些事情上為開發(fā)者節(jié)省了時(shí)間,開發(fā)者就能將工作更多放在頂層設(shè)計(jì)上——怎么把代碼的架構(gòu)設(shè)計(jì)地更好、功能考慮地更完善,從而提高軟件的質(zhì)量。
智譜在2022年就完成了CodeGeeX代碼大模型的訓(xùn)練,并同時(shí)推出了 CodeGeeX插件產(chǎn)品。
跟GitHub Copilot 一樣,CodeGeeX定位是智能輔助編程,但輔助也分為不同層級(jí),目前已經(jīng)從單個(gè)文件輔助拓展到了項(xiàng)目級(jí)輔助編程,因?yàn)閷?shí)際開發(fā)場(chǎng)景中不可能只有單文件,大多都是多文件。
CodeGeeX負(fù)責(zé)人鄭勤鍇稱,往項(xiàng)目級(jí)拓展的挑戰(zhàn)在于項(xiàng)目生成的成功率,因?yàn)榇a項(xiàng)目往往不只是一小段代碼或者一個(gè)文件的代碼組成,而是同時(shí)需要完成項(xiàng)目中跨文件的代碼理解和生成補(bǔ)全。讓模型能充分理解更長(zhǎng)的信息,并提取到關(guān)鍵部分,這對(duì)模型的要求很高。
對(duì)于參數(shù)量10B以下的代碼大模型,從海量的代碼中準(zhǔn)確提取信息是一個(gè)關(guān)鍵性的挑戰(zhàn)。CodeGeeX4支持128K上下文,能夠處理和利用更長(zhǎng)代碼文件、包括項(xiàng)目代碼中的信息,是模型更深入理解復(fù)雜和細(xì)節(jié)豐富的代碼的關(guān)鍵點(diǎn)。
一位投資人認(rèn)為,做 AI 編程助手沒(méi)人能拼得過(guò) GitHub Copilot。
GitHub Copilot 主要 To C,面向個(gè)人開發(fā)者定價(jià)每月 10 美元(約 66.9 元人民幣)或每年 100 美元(約 669 元人民幣)。
To B 企業(yè)用戶月費(fèi) 39 美元,企業(yè)用戶可以將代碼部署到云端,而不必在本地反復(fù)克??;企業(yè)用戶可以內(nèi)建知識(shí)庫(kù),形成個(gè)性化的Copilot Chat(在原有Copilot的基礎(chǔ)之上,開發(fā)者可以直接用自然語(yǔ)言和Copilot對(duì)話來(lái)解決遇到的問(wèn)題),甚至是對(duì)底層模型進(jìn)行微調(diào)。
除了占據(jù)時(shí)間上的先發(fā)優(yōu)勢(shì),GitHub Copilot 擁有兩大先天優(yōu)勢(shì),一是背靠擁有上億開發(fā)者的代碼托管平臺(tái) GitHub,二是底層接入的是 OpenAI 最強(qiáng)的模型。
站在今天來(lái)看,微軟對(duì)開發(fā)者市場(chǎng)的戰(zhàn)略一直很清晰:2015 年推出跨平臺(tái)代碼編輯器 VScode,從用戶側(cè)統(tǒng)一IDE;2018 年收購(gòu) GitHub,擁有大量代碼數(shù)據(jù)(包括商用的未公開的數(shù)據(jù));2019 年,微軟向 OpenAI 投資了 10 億美金,并獲得了 OpenAI 技術(shù)的商業(yè)化授權(quán)。
于是,在 2020 年 OpenAI 推出了 GPT-3 后,拿著最多的代碼數(shù)據(jù)去訓(xùn)練模型,隔年 AI 編程工具 GitHub Copilot被推出,成為全球最早一款大模型 AI 編程工具,搶占了先發(fā)優(yōu)勢(shì)。
今年 4 月微軟 CEO 稱 GitHub Copilot 已經(jīng)擁有 180 萬(wàn)付費(fèi)訂閱用戶。
但也有多位從業(yè)者認(rèn)為 GitHub Copilot 并非能一統(tǒng)天下。
“對(duì)于國(guó)內(nèi)市場(chǎng)而言,商業(yè)化機(jī)會(huì)在 B 端?!鼻辶髻Y本合伙人劉博告訴 AI 科技評(píng)論。
首先,AI 編程產(chǎn)品面向的中大型企業(yè) B 端市場(chǎng)大概是幾十億人民幣的規(guī)模,用戶付費(fèi)意愿非常明確,這一市場(chǎng)規(guī)模和客單價(jià)在軟件服務(wù)市場(chǎng)上已經(jīng)比較客觀。
對(duì)于國(guó)內(nèi) B 端用戶而言,他們有兩個(gè)需求是 GitHub Copilot 無(wú)法滿足的:1)模型本地部署,如果云端調(diào)用 GitHub Copilot 會(huì)有代碼泄露的風(fēng)險(xiǎn)同時(shí)本地部署后可以根據(jù)客戶的私有代碼進(jìn)一步訓(xùn)練,顯著提升代碼生成的效果;2)大客戶需要選擇國(guó)內(nèi)的產(chǎn)品作為供應(yīng)商,避免數(shù)據(jù)外流。
照著以上標(biāo)準(zhǔn)來(lái)找標(biāo)的,清流資本在去年 9 月參與了國(guó)內(nèi)面向企業(yè)的智能化軟件開發(fā)解決方案提供商 aiXcoder A+ 輪投資。跟 GitHub copilot 不同,aiXcoder 聚焦 To B,為企業(yè)提供基于代碼大模型的智能化軟件開發(fā)解決方案,包含私有化部署、企業(yè)領(lǐng)域知識(shí)與大模型融合、定制化開發(fā)等服務(wù)。清流資本合伙人劉博告訴 AI 科技評(píng)論,B 端市場(chǎng)的打法是當(dāng)公司在一個(gè)行業(yè)里已經(jīng)滲透了足夠多的客戶后,就能成為 AI Coding工具實(shí)質(zhì)上的行業(yè)標(biāo)準(zhǔn),成為行業(yè)里其他企業(yè)采購(gòu) AI Coding 工具時(shí)必須邀請(qǐng)參與競(jìng)標(biāo)的供應(yīng)商。因此從國(guó)內(nèi)的商業(yè)化角度出發(fā),先發(fā)優(yōu)勢(shì)和聚焦很重要。aiXcoder孵化自北京大學(xué)軟件工程研究所,在2013年就開始研究深度學(xué)習(xí)跟代碼結(jié)合,早在 2022 年 6 月便發(fā)布了中國(guó)首個(gè)百億級(jí)參數(shù)的代碼大模型 aiXcoder-13B,能夠支持方法級(jí)(函數(shù)級(jí))的代碼補(bǔ)全。aiXcoder COO 李力行認(rèn)為,代碼大模型落地時(shí),如何跟企業(yè)的領(lǐng)域知識(shí)或者私域知識(shí)相結(jié)合非常關(guān)鍵,從而保證生成的代碼更準(zhǔn)確,因?yàn)榇a生成要用到很多上下文信息,以及一些外部的領(lǐng)域知識(shí),領(lǐng)域知識(shí)是指企業(yè)的業(yè)務(wù)邏輯、業(yè)務(wù)知識(shí)等等。一位資深從業(yè)者認(rèn)為,高質(zhì)量的數(shù)據(jù)才是模型能力的區(qū)隔。公開的數(shù)據(jù)可能有一天終會(huì)達(dá)到瓶頸,但世界上還有大量的私有數(shù)據(jù)可能永遠(yuǎn)不會(huì)被公開,它們存在于各個(gè) B 端企業(yè)內(nèi)部,與企業(yè)業(yè)務(wù)邏輯強(qiáng)耦合。aiXcoder 在為客戶做本地部署的時(shí)候會(huì)基于這些私有化數(shù)據(jù)進(jìn)行再訓(xùn)練,給每個(gè)企業(yè)打造專屬的代碼大模型。
GitHub Copilot 占據(jù)了 C 端優(yōu)勢(shì)地位,國(guó)內(nèi)玩家不約而同選擇了 C 端免費(fèi)策略,如智譜 CodeGeeX、百度Comate、騰訊云 AI 代碼助手都推出了面向個(gè)人開發(fā)者的免費(fèi)工具,這幾家廠商跟 aiXcoder 一樣、將商業(yè)化看向 B 端。
它們共同的思路是拿代碼數(shù)據(jù)在各自的基座大模型上進(jìn)行預(yù)訓(xùn)練或者微調(diào),相同的代碼數(shù)據(jù)來(lái)自GitHub和其他可公開訪問(wèn)的源代碼,百度、阿里、騰訊這些大廠還有一部分內(nèi)部代碼的積累。
收集數(shù)據(jù)的方式、選取數(shù)據(jù)的類型、訓(xùn)練的方法……整個(gè)訓(xùn)練過(guò)程多個(gè)環(huán)節(jié)的差異導(dǎo)致各個(gè)代碼模型效果各異。
例如智譜 CodeGeeX 推出一體機(jī)的模式,開箱即用,提供完善的軟硬件和使用方式,特點(diǎn)是可以結(jié)合企業(yè)內(nèi)部的代碼倉(cāng)庫(kù)、知識(shí)庫(kù)來(lái)加強(qiáng)代碼能力,優(yōu)勢(shì)是代碼是私有化安全的。
企業(yè)更關(guān)注怎么跟企業(yè)內(nèi)部的代碼、數(shù)據(jù)文檔做結(jié)合,在模型訓(xùn)練階段對(duì)這些代碼并不了解,包括企業(yè)內(nèi)部自己定義的 API 接口等等。
為了讓模型更懂企業(yè)的代碼,CodeGeeX 提供了幾個(gè)方向:定制化的微調(diào)方案,在企業(yè)內(nèi)部去用它們自己的代碼去對(duì)模型進(jìn)行強(qiáng)化,還包括 RAG 檢索增強(qiáng)方案,即把企業(yè)代碼和文檔作為知識(shí)庫(kù)來(lái)輔助預(yù)測(cè)。
有投資人并不看好創(chuàng)業(yè)公司做代碼大模型,他們認(rèn)為 AI Coding 這塊未來(lái)依然是通用大模型公司的事情,大模型公司更擅長(zhǎng)做這件事,創(chuàng)業(yè)公司很難產(chǎn)生差異化,而且競(jìng)爭(zhēng)對(duì)手太多了。
而且,軟件 To B 一直面臨的問(wèn)題是國(guó)內(nèi) B 端客戶用不起,這是國(guó)內(nèi) SaaS 一直沒(méi)做起來(lái)的原因之一。
的確,根據(jù)開發(fā)者的反饋,如 GPT-4o、Claude 3.5 Sonnet 這樣的通用大模型現(xiàn)在也能保持不錯(cuò)的代碼效果。
一位從業(yè)者認(rèn)為,未來(lái)可能會(huì)有一個(gè)在所有模態(tài)上都很強(qiáng)的六邊形戰(zhàn)士模型,但真正從B端商業(yè)化落地來(lái)看,不太有太多公司有能力本地部署這樣一個(gè)參數(shù)量巨大的六邊形戰(zhàn)士模型,市場(chǎng)仍然需要一個(gè)代碼垂直模型。
那么創(chuàng)業(yè)公司如何跟大廠競(jìng)爭(zhēng)?
大廠在理論上可以做所有的事情,但:
首先,大廠需要在所有能做的事情里去選擇以及決定對(duì)應(yīng)的資源調(diào)配,對(duì)于大廠而言,有太多方向可以得到比單個(gè) B 端 coding 場(chǎng)景更多的資源,比如通用大模型、AGI 等,而創(chuàng)業(yè)公司 100% 聚焦在一件事上;
其次,在垂直場(chǎng)景里,大廠的認(rèn)知不一定比創(chuàng)業(yè)公司更深。B 端 AI coding是一個(gè)非常垂直且專業(yè)的場(chǎng)景,在大模型的基礎(chǔ)上仍然需要大量進(jìn)階的代碼 knowhow 和對(duì)客戶需求的深度洞察。
aiXcoder COO李力行認(rèn)為,首先需要通過(guò)全流程的數(shù)據(jù)治理和個(gè)性化訓(xùn)練,使大模型能夠深刻理解并掌握企業(yè)領(lǐng)域知識(shí),落地企業(yè)專屬代碼大模型;隨后,利用多 agent 等方式結(jié)合傳統(tǒng)軟件開發(fā)工具和方法,高效地解決企業(yè)復(fù)雜的軟件開發(fā)任務(wù)。
軟件開發(fā)是一個(gè)復(fù)雜的系統(tǒng)工程,coding只占其中很少的部分,還涉及到需求理解、debugging、優(yōu)化、部署等多個(gè)環(huán)節(jié)。而以 GitHub Copilot 為首的 AI 編程輔助產(chǎn)品現(xiàn)在只能寫點(diǎn)“函數(shù)磚頭”,砌墻的事還得程序員親自來(lái)。
但 Devin 的出現(xiàn)滿足了外界對(duì) AI 軟件開發(fā)的想象力,不止于 coding 階段。
在 3 月初創(chuàng)公司 Cognition 的 demo 演示中,Devin 化身為一個(gè)擁有“全棧技能”的AI程序員,一個(gè)能夠獨(dú)立完成任務(wù)的自助系統(tǒng),在快速原型設(shè)計(jì)、修復(fù)bug和復(fù)雜數(shù)據(jù)的可視化上表現(xiàn)優(yōu)秀。
從交互上,Devin 帶來(lái)了一種新的AI軟件開發(fā)形態(tài),包括命令行、瀏覽器等組件,是第一個(gè)脫離 IDE 的軟件開發(fā)形態(tài)。從實(shí)際任務(wù)上,Devin 愿景是完成整個(gè)軟件開發(fā)的需求任務(wù),這種能完成更復(fù)雜開發(fā)任務(wù)的 Agent 已經(jīng)成為業(yè)內(nèi)確定的產(chǎn)品趨勢(shì)。
而 Devin 則被稱為 Agent 的“ChatGPT 時(shí)刻”。
一位 AI Agent 創(chuàng)業(yè)者趙聰認(rèn)為,issue level 的 coding 都需要用 Agent 來(lái)實(shí)現(xiàn),解決的是更復(fù)雜的問(wèn)題,自動(dòng)解 issue。issue 等同于文件級(jí)的代碼,而現(xiàn)在的代碼生成、補(bǔ)全都是在單文件上,解 issue 往往是針對(duì)整個(gè)項(xiàng)目,擁有多個(gè)文件。
aiXcoder COO 李力行看好 Agent 在軟件開發(fā)領(lǐng)域的應(yīng)用,他認(rèn)為多 Agent 協(xié)作也讓全流程代碼生成等更加復(fù)雜的開發(fā)任務(wù)成為可能。在2024年, aiXcoder 推出基于Agent技術(shù)的智能化軟件開發(fā)系統(tǒng)2.0,通過(guò)大模型+軟件開發(fā)工具調(diào)用解決企業(yè)項(xiàng)目級(jí)代碼生成問(wèn)題,確保復(fù)雜開發(fā)場(chǎng)景下代碼生成的高效性、準(zhǔn)確性和可靠性。
Devin 想要去解決一個(gè)問(wèn)題,或者說(shuō)修改一個(gè)倉(cāng)密度的代碼,大家都在朝著 Devin 的方向做探索,但大模型能力現(xiàn)在幾乎還達(dá)不到。目前 Agent 還處于探索、實(shí)驗(yàn)階段。
距離 Devin 發(fā)布已經(jīng)過(guò)去五個(gè)月,依然沒(méi)有任何更進(jìn)一步的消息。其 CEO Scott 也透露,他們尚無(wú)明確的公開預(yù)覽(public preview)時(shí)間表,目前仍在內(nèi)測(cè)階段,即無(wú)確定的產(chǎn)品形態(tài)。
CodeGeeX 負(fù)責(zé)人鄭勤鍇則認(rèn)為,Agent 只是實(shí)現(xiàn)某個(gè)功能的路徑,現(xiàn)在的 Agent 很多只是簡(jiǎn)單的工具調(diào)用。重要的還是看最終實(shí)現(xiàn)的功能,能達(dá)到多高的可用性。
趙聰認(rèn)為未來(lái)的創(chuàng)業(yè)機(jī)會(huì)在 AI Agent,因?yàn)?AI 編程賽道上 Copilot 微軟已經(jīng)做了,很難再與之競(jìng)爭(zhēng),所以只能往前走,即直接替代人。開發(fā)者平時(shí)很多工作都類似于拿著螺絲刀擰螺絲,Copilot 就是把螺絲刀換成了電鉆,而 AI 程序員則是給開發(fā)者配個(gè)小弟,所以 Copilot 依然是個(gè)好工具,但 AI 程序員就是生產(chǎn)力,這是完全不同的兩件事。
但做 AI 程序員不是科學(xué)問(wèn)題,而是個(gè)工程問(wèn)題。這里涉及路徑選擇的問(wèn)題,在做 AI 程序員時(shí)有公司是自己做模型,趙聰認(rèn)為這是錯(cuò)誤的路徑,他不相信所謂的小模型/垂直模型,覺(jué)得模型就只有大模型,因?yàn)橹挥写竽P湍軒?lái)智力。
未來(lái)面臨的挑戰(zhàn)是,所有人都要往 project level coding 走,要依賴底層模型的進(jìn)化,但模型太貴。趙聰認(rèn)為GPT-4 至少得再降價(jià) 10 倍,才具有真正的可能性。
在軟件工程中,AI 難以解決的兩大問(wèn)題是:1)復(fù)雜項(xiàng)目的業(yè)務(wù)上下文理解。2)每家公司獨(dú)特的工程架構(gòu)、邏輯和實(shí)踐。在解決這兩個(gè)問(wèn)題之前,AI Agent 還無(wú)法完全替代人類程序員。
但多位從業(yè)者一致認(rèn)為,隨著 AI 不斷進(jìn)化,未來(lái)高級(jí)程序員不會(huì)被替代,擰螺絲的初級(jí)程序員被替代已經(jīng)能看到,未來(lái)程序員的培養(yǎng)路徑也跟現(xiàn)在不一樣,就像高科技種地,不需要真的從種地開始學(xué),而是先從學(xué)習(xí)使用工具開始。
未來(lái) C 端應(yīng)該更好地服務(wù)普通人,而不僅僅是開發(fā)者,如果普通人也能通過(guò) AI 實(shí)現(xiàn)編程,那么 C 端有可能完成一次爆發(fā),而這需要更強(qiáng)的模型能力,端到端仍然需要 Agent 來(lái)實(shí)現(xiàn)。
但可以肯定的是,未來(lái)程序員逐漸都會(huì)離不開 AI 編程工具?!咐追寰W(wǎng)」
(文中趙聰為化名)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。