丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給張進
發(fā)送

0

代碼生成三問:如何打造 24 小時在線的 AI 程序員?

本文作者: 張進 2024-08-28 10:22
導(dǎo)語:Copilot 是過程,Agent 才是通往成功的方向。

「雷峰網(wǎng)」2024 年年初,擁有編程全棧技能的 Devin 驚艷全球,讓外界看到了 AI 改變一個行業(yè)——替代程序員的可能性。

Devin 發(fā)布數(shù)周后,其背后的公司 Cognition 也隨即獲得 1.75 億美元融資,估值從 3.5 億美元一躍升至 20 億美元。緊接著,4 月,一家 AI 編碼輔助創(chuàng)業(yè)公司 Augment 宣布完成 2.52 億美元的融資,投后估值接近獨角獸,代碼生成賽道的多米諾骨牌效應(yīng)開始出現(xiàn)……

到上半年,硅谷代碼生成類的公司估值起步價已經(jīng)高達 2 億美金,頭部公司甚至 20 億美金。而據(jù)一位行業(yè)人士分析,代碼生成的概念之所以受到追捧,其中一個重要原因是“人類的數(shù)據(jù)不夠用了”。

AGI 時代的一個重要組成是人類必須依靠機器生成的數(shù)據(jù),而代碼生成的數(shù)據(jù)被部分從業(yè)者認為是“人類通往 AGI 過程中最有邏輯性與嚴謹?shù)臄?shù)據(jù)”。

與此同時,網(wǎng)絡(luò)上為大模型代碼生成提效歡呼的聲音越來越多。例如,一位中國開發(fā)者就提出,Claude 3.5 Sonnet 只要 500+ 行的 html 就能實現(xiàn)一個不錯的功能;還有開發(fā)者稱,其借助 GPT-4o 輔助代碼寫作,以前開發(fā)小程序需要一個月,現(xiàn)在只需要七天……

根據(jù)開發(fā)者的反饋,大模型的代碼生成能力正在真切地提升每位開發(fā)者的工作效率。

事實上,程序員對于“AI 代碼生成”的想象早有年頭。在這波生成式 AI 浪潮之前,市場上就已出現(xiàn)一系列的 AI 編程工具,例如 Tabnine、Kite 等,但受限于它們的技術(shù)路徑,過去的產(chǎn)品對于上下文邏輯的理解和代碼生成的質(zhì)量不盡人意。

清流資本合伙人劉博告訴 AI 科技評論,AI 編碼工具的其中一個效果評估指標(biāo)是代碼文件中由模型生成的代碼占比,上一代工具只能做到 10-20%,而新一代的 AI 編程工具最高可以做到 40-50%——這是質(zhì)的飛躍,同時新一代工具對編程上下文的理解也顯著更好。

微軟 CEO 稱,兩年前上線的 AI 編程工具 GitHub Copilot(后接入 GPT-4 模型后更名為“Copilot X”)已經(jīng)開始獲利、并擁有 180 萬付費訂閱用戶。

迄今大模型狂飆一年半,在所有基于大模型的新 AI 工具中,coding 場景的 PMF 和付費意愿最先被驗證,GitHub Copilot 僅用 14 個月便達到了 1 億美元 ARR,是歷史上增長最快的 SaaS 產(chǎn)品——這與其他場景里曇花一現(xiàn)的 AI 產(chǎn)品形成鮮明對比。

幾乎所有的通用大模型公司都推出了代碼大模型和 AI 編程助手,如 OpenAI codex、Meta Code Llama、智譜 CodeGeeX、百度的 comate、騰訊云的 AI 代碼助手、DeepSeek Coder……

國內(nèi)創(chuàng)業(yè)公司也開始增多:一站式 DevOps 研發(fā)管理平臺 Coding 創(chuàng)始人張海龍創(chuàng)立了 AI Agent 公司 Babel,企業(yè)智能化軟件開發(fā)解決方案提供商 aiXcoder 也因此受到資本關(guān)注、并在2023年迅速完成了 A+ 輪融資。

多方勢力角逐,創(chuàng)業(yè)公司在混亂中爭取生機,而創(chuàng)業(yè)公司、通用大模型公司、科技大廠各方仍然面臨 AI 領(lǐng)域發(fā)展的通用問題:To C 還是To B,技術(shù)路徑選擇通用大模型還是垂直模型,要不要自研模型,以及如何在 GitHub Copilot 的籠罩下突圍。

值得注意的是,受限于底層技術(shù)大模型的能力,目前各種 AI 編程產(chǎn)品仍然集中于 coding 階段,在代碼補全和代碼生成兩個場景 PK,所以本質(zhì)上,現(xiàn)在的 AI 編程產(chǎn)品依然是 AI coding。

但盡管如此,“24 小時 AI 程序員”的生產(chǎn)力仍然讓所有人著迷。


1
為什么對 coding 情有獨鐘?

當(dāng)前大多數(shù) AI coding 產(chǎn)品主攻代碼補全和代碼生成兩個高頻場景。

軟件開發(fā)的智能化最開始就是從代碼生成和代碼補全開始的。因為技術(shù)容易實現(xiàn),不會顛覆程序員的開發(fā)模型,代碼補全是整個行業(yè)做的比較成熟的功能,不管是大廠還是初創(chuàng)公司,產(chǎn)品都能用起來,且正確率較高。

在一個已有的項目中根據(jù)上下文去增加新功能叫代碼補全,即開發(fā)者用自然語言表達一個需求,用代碼生成。代碼生成現(xiàn)在正處于從文件級代碼到項目級代碼的突破。

代碼生成還處于初級階段,簡單的函數(shù)能生成得比較好,但并不是完全靠大模型,需要外掛一些知識庫配合,不能達到100%準確,若再想擴展到一個文件級的代碼生成,難度則會增高,往倉級別的難度會更高,而 Devin 展示的就是往倉級別去實現(xiàn)。

一位研究代碼智能的專家告訴 AI 科技評論,代碼補全現(xiàn)在是兵家必爭之地,是已經(jīng)真正落地、也是程序員使用最多的場景。相對來說,代碼生成功能的使用頻率相對少一些,目前要真正融入到日常的開發(fā)成為高頻選項還有一些距離,原因是代碼生成需要改變程序員的開發(fā)模式、開發(fā)習(xí)慣。代碼生成目前依然是通過跟一個對話機器人對話,用自然語言表達需求來讓大模型生成一段代碼,在這個過程中不斷交互、表達需求,需求表達地越清晰、生成的代碼越準確。這過程中涉及到需求拆解。將一個大的需求拆解成一個個的小任務(wù),再去生成,需求拆解對于當(dāng)前大模型來說還有難度。同時,由于編程思維跟自然語言表達是兩回事,對于開發(fā)者來說,一個人代碼寫的好,并不意味著用自然語言表達業(yè)務(wù)邏輯好,它需要具備兩方面的能力。一是要熟悉業(yè)務(wù),二是要扎實的計算機理論知識,包括算法,操作系統(tǒng),軟件工程,計算機安全等,這其實對開發(fā)者的個人素養(yǎng)提出了很高的要求。

除了代碼補全和代碼生成兩個高頻場景,其他產(chǎn)品尋求差異化的出口是提供代碼注釋、代碼解讀、代碼 bug 修復(fù)、代碼優(yōu)化、漏洞檢測等能力。

例如國內(nèi)智譜 CodeGeeX 便開發(fā)了獨有的功能,例如去年年底推出的工具箱,就是基于模型具備Code Interpreter代碼解釋器能力,可以批量處理多種格式的文件、批量實現(xiàn)數(shù)據(jù)可視化、繪制數(shù)學(xué)函數(shù)圖等。

CodeGeeX 負責(zé)人鄭勤鍇認為,在這些事情上為開發(fā)者節(jié)省了時間,開發(fā)者就能將工作更多放在頂層設(shè)計上——怎么把代碼的架構(gòu)設(shè)計地更好、功能考慮地更完善,從而提高軟件的質(zhì)量。

智譜在2022年就完成了CodeGeeX代碼大模型的訓(xùn)練,并同時推出了 CodeGeeX插件產(chǎn)品。

跟GitHub Copilot 一樣,CodeGeeX定位是智能輔助編程,但輔助也分為不同層級,目前已經(jīng)從單個文件輔助拓展到了項目級輔助編程,因為實際開發(fā)場景中不可能只有單文件,大多都是多文件。

CodeGeeX負責(zé)人鄭勤鍇稱,往項目級拓展的挑戰(zhàn)在于項目生成的成功率,因為代碼項目往往不只是一小段代碼或者一個文件的代碼組成,而是同時需要完成項目中跨文件的代碼理解和生成補全。讓模型能充分理解更長的信息,并提取到關(guān)鍵部分,這對模型的要求很高。

對于參數(shù)量10B以下的代碼大模型,從海量的代碼中準確提取信息是一個關(guān)鍵性的挑戰(zhàn)。CodeGeeX4支持128K上下文,能夠處理和利用更長代碼文件、包括項目代碼中的信息,是模型更深入理解復(fù)雜和細節(jié)豐富的代碼的關(guān)鍵點。


2
如何跟 GitHub Copilot 競爭?

一位投資人認為,做 AI 編程助手沒人能拼得過 GitHub Copilot。

GitHub Copilot 主要 To C,面向個人開發(fā)者定價每月 10 美元(約 66.9 元人民幣)或每年 100 美元(約 669 元人民幣)。

To B 企業(yè)用戶月費 39 美元,企業(yè)用戶可以將代碼部署到云端,而不必在本地反復(fù)克??;企業(yè)用戶可以內(nèi)建知識庫,形成個性化的Copilot Chat(在原有Copilot的基礎(chǔ)之上,開發(fā)者可以直接用自然語言和Copilot對話來解決遇到的問題),甚至是對底層模型進行微調(diào)。

除了占據(jù)時間上的先發(fā)優(yōu)勢,GitHub Copilot 擁有兩大先天優(yōu)勢,一是背靠擁有上億開發(fā)者的代碼托管平臺 GitHub,二是底層接入的是 OpenAI 最強的模型。

站在今天來看,微軟對開發(fā)者市場的戰(zhàn)略一直很清晰:2015 年推出跨平臺代碼編輯器 VScode,從用戶側(cè)統(tǒng)一IDE;2018 年收購 GitHub,擁有大量代碼數(shù)據(jù)(包括商用的未公開的數(shù)據(jù));2019 年,微軟向 OpenAI 投資了 10 億美金,并獲得了 OpenAI 技術(shù)的商業(yè)化授權(quán)。

于是,在 2020 年 OpenAI 推出了 GPT-3 后,拿著最多的代碼數(shù)據(jù)去訓(xùn)練模型,隔年 AI 編程工具 GitHub Copilot被推出,成為全球最早一款大模型 AI 編程工具,搶占了先發(fā)優(yōu)勢。

今年 4 月微軟 CEO 稱 GitHub Copilot 已經(jīng)擁有 180 萬付費訂閱用戶。

但也有多位從業(yè)者認為 GitHub Copilot 并非能一統(tǒng)天下。

“對于國內(nèi)市場而言,商業(yè)化機會在 B 端?!鼻辶髻Y本合伙人劉博告訴 AI 科技評論。

首先,AI 編程產(chǎn)品面向的中大型企業(yè) B 端市場大概是幾十億人民幣的規(guī)模,用戶付費意愿非常明確,這一市場規(guī)模和客單價在軟件服務(wù)市場上已經(jīng)比較客觀。

對于國內(nèi) B 端用戶而言,他們有兩個需求是 GitHub Copilot 無法滿足的:1)模型本地部署,如果云端調(diào)用 GitHub Copilot 會有代碼泄露的風(fēng)險同時本地部署后可以根據(jù)客戶的私有代碼進一步訓(xùn)練,顯著提升代碼生成的效果;2)大客戶需要選擇國內(nèi)的產(chǎn)品作為供應(yīng)商,避免數(shù)據(jù)外流。

照著以上標(biāo)準來找標(biāo)的,清流資本在去年 9 月參與了國內(nèi)面向企業(yè)的智能化軟件開發(fā)解決方案提供商 aiXcoder A+ 輪投資。跟 GitHub copilot 不同,aiXcoder 聚焦 To B,為企業(yè)提供基于代碼大模型的智能化軟件開發(fā)解決方案,包含私有化部署、企業(yè)領(lǐng)域知識與大模型融合、定制化開發(fā)等服務(wù)。清流資本合伙人劉博告訴 AI 科技評論,B 端市場的打法是當(dāng)公司在一個行業(yè)里已經(jīng)滲透了足夠多的客戶后,就能成為 AI Coding工具實質(zhì)上的行業(yè)標(biāo)準,成為行業(yè)里其他企業(yè)采購 AI Coding 工具時必須邀請參與競標(biāo)的供應(yīng)商。因此從國內(nèi)的商業(yè)化角度出發(fā),先發(fā)優(yōu)勢和聚焦很重要。aiXcoder孵化自北京大學(xué)軟件工程研究所,在2013年就開始研究深度學(xué)習(xí)跟代碼結(jié)合,早在 2022 年 6 月便發(fā)布了中國首個百億級參數(shù)的代碼大模型 aiXcoder-13B,能夠支持方法級(函數(shù)級)的代碼補全。aiXcoder COO 李力行認為,代碼大模型落地時,如何跟企業(yè)的領(lǐng)域知識或者私域知識相結(jié)合非常關(guān)鍵,從而保證生成的代碼更準確,因為代碼生成要用到很多上下文信息,以及一些外部的領(lǐng)域知識,領(lǐng)域知識是指企業(yè)的業(yè)務(wù)邏輯、業(yè)務(wù)知識等等。一位資深從業(yè)者認為,高質(zhì)量的數(shù)據(jù)才是模型能力的區(qū)隔。公開的數(shù)據(jù)可能有一天終會達到瓶頸,但世界上還有大量的私有數(shù)據(jù)可能永遠不會被公開,它們存在于各個 B 端企業(yè)內(nèi)部,與企業(yè)業(yè)務(wù)邏輯強耦合。aiXcoder 在為客戶做本地部署的時候會基于這些私有化數(shù)據(jù)進行再訓(xùn)練,給每個企業(yè)打造專屬的代碼大模型。


3
通用大模型還是垂直模型?

GitHub Copilot 占據(jù)了 C 端優(yōu)勢地位,國內(nèi)玩家不約而同選擇了 C 端免費策略,如智譜 CodeGeeX、百度Comate、騰訊云 AI 代碼助手都推出了面向個人開發(fā)者的免費工具,這幾家廠商跟 aiXcoder 一樣、將商業(yè)化看向 B 端。

它們共同的思路是拿代碼數(shù)據(jù)在各自的基座大模型上進行預(yù)訓(xùn)練或者微調(diào),相同的代碼數(shù)據(jù)來自GitHub和其他可公開訪問的源代碼,百度、阿里、騰訊這些大廠還有一部分內(nèi)部代碼的積累。

收集數(shù)據(jù)的方式、選取數(shù)據(jù)的類型、訓(xùn)練的方法……整個訓(xùn)練過程多個環(huán)節(jié)的差異導(dǎo)致各個代碼模型效果各異。

例如智譜 CodeGeeX 推出一體機的模式,開箱即用,提供完善的軟硬件和使用方式,特點是可以結(jié)合企業(yè)內(nèi)部的代碼倉庫、知識庫來加強代碼能力,優(yōu)勢是代碼是私有化安全的。

企業(yè)更關(guān)注怎么跟企業(yè)內(nèi)部的代碼、數(shù)據(jù)文檔做結(jié)合,在模型訓(xùn)練階段對這些代碼并不了解,包括企業(yè)內(nèi)部自己定義的 API 接口等等。

為了讓模型更懂企業(yè)的代碼,CodeGeeX 提供了幾個方向:定制化的微調(diào)方案,在企業(yè)內(nèi)部去用它們自己的代碼去對模型進行強化,還包括 RAG 檢索增強方案,即把企業(yè)代碼和文檔作為知識庫來輔助預(yù)測。

有投資人并不看好創(chuàng)業(yè)公司做代碼大模型,他們認為 AI Coding 這塊未來依然是通用大模型公司的事情,大模型公司更擅長做這件事,創(chuàng)業(yè)公司很難產(chǎn)生差異化,而且競爭對手太多了。

而且,軟件 To B 一直面臨的問題是國內(nèi) B 端客戶用不起,這是國內(nèi) SaaS 一直沒做起來的原因之一。

的確,根據(jù)開發(fā)者的反饋,如 GPT-4o、Claude 3.5 Sonnet 這樣的通用大模型現(xiàn)在也能保持不錯的代碼效果。

一位從業(yè)者認為,未來可能會有一個在所有模態(tài)上都很強的六邊形戰(zhàn)士模型,但真正從B端商業(yè)化落地來看,不太有太多公司有能力本地部署這樣一個參數(shù)量巨大的六邊形戰(zhàn)士模型,市場仍然需要一個代碼垂直模型。

那么創(chuàng)業(yè)公司如何跟大廠競爭?

大廠在理論上可以做所有的事情,但:

首先,大廠需要在所有能做的事情里去選擇以及決定對應(yīng)的資源調(diào)配,對于大廠而言,有太多方向可以得到比單個 B 端 coding 場景更多的資源,比如通用大模型、AGI 等,而創(chuàng)業(yè)公司 100% 聚焦在一件事上;

其次,在垂直場景里,大廠的認知不一定比創(chuàng)業(yè)公司更深。B 端 AI coding是一個非常垂直且專業(yè)的場景,在大模型的基礎(chǔ)上仍然需要大量進階的代碼 knowhow 和對客戶需求的深度洞察。

aiXcoder COO李力行認為,首先需要通過全流程的數(shù)據(jù)治理和個性化訓(xùn)練,使大模型能夠深刻理解并掌握企業(yè)領(lǐng)域知識,落地企業(yè)專屬代碼大模型;隨后,利用多 agent 等方式結(jié)合傳統(tǒng)軟件開發(fā)工具和方法,高效地解決企業(yè)復(fù)雜的軟件開發(fā)任務(wù)。


4
Agent 是趨勢

軟件開發(fā)是一個復(fù)雜的系統(tǒng)工程,coding只占其中很少的部分,還涉及到需求理解、debugging、優(yōu)化、部署等多個環(huán)節(jié)。而以 GitHub Copilot 為首的 AI 編程輔助產(chǎn)品現(xiàn)在只能寫點“函數(shù)磚頭”,砌墻的事還得程序員親自來。

但 Devin 的出現(xiàn)滿足了外界對 AI 軟件開發(fā)的想象力,不止于 coding 階段。

在 3 月初創(chuàng)公司 Cognition 的 demo 演示中,Devin 化身為一個擁有“全棧技能”的AI程序員,一個能夠獨立完成任務(wù)的自助系統(tǒng),在快速原型設(shè)計、修復(fù)bug和復(fù)雜數(shù)據(jù)的可視化上表現(xiàn)優(yōu)秀。

從交互上,Devin 帶來了一種新的AI軟件開發(fā)形態(tài),包括命令行、瀏覽器等組件,是第一個脫離 IDE 的軟件開發(fā)形態(tài)。從實際任務(wù)上,Devin 愿景是完成整個軟件開發(fā)的需求任務(wù),這種能完成更復(fù)雜開發(fā)任務(wù)的 Agent 已經(jīng)成為業(yè)內(nèi)確定的產(chǎn)品趨勢。

而 Devin 則被稱為 Agent 的“ChatGPT 時刻”。

一位 AI Agent 創(chuàng)業(yè)者趙聰認為,issue level 的 coding 都需要用 Agent 來實現(xiàn),解決的是更復(fù)雜的問題,自動解 issue。issue 等同于文件級的代碼,而現(xiàn)在的代碼生成、補全都是在單文件上,解 issue 往往是針對整個項目,擁有多個文件。

aiXcoder COO 李力行看好 Agent 在軟件開發(fā)領(lǐng)域的應(yīng)用,他認為多 Agent 協(xié)作也讓全流程代碼生成等更加復(fù)雜的開發(fā)任務(wù)成為可能。在2024年, aiXcoder 推出基于Agent技術(shù)的智能化軟件開發(fā)系統(tǒng)2.0,通過大模型+軟件開發(fā)工具調(diào)用解決企業(yè)項目級代碼生成問題,確保復(fù)雜開發(fā)場景下代碼生成的高效性、準確性和可靠性。

Devin 想要去解決一個問題,或者說修改一個倉密度的代碼,大家都在朝著 Devin 的方向做探索,但大模型能力現(xiàn)在幾乎還達不到。目前 Agent 還處于探索、實驗階段。

距離 Devin 發(fā)布已經(jīng)過去五個月,依然沒有任何更進一步的消息。其 CEO Scott 也透露,他們尚無明確的公開預(yù)覽(public preview)時間表,目前仍在內(nèi)測階段,即無確定的產(chǎn)品形態(tài)。

CodeGeeX 負責(zé)人鄭勤鍇則認為,Agent 只是實現(xiàn)某個功能的路徑,現(xiàn)在的 Agent 很多只是簡單的工具調(diào)用。重要的還是看最終實現(xiàn)的功能,能達到多高的可用性。

趙聰認為未來的創(chuàng)業(yè)機會在 AI Agent,因為 AI 編程賽道上 Copilot 微軟已經(jīng)做了,很難再與之競爭,所以只能往前走,即直接替代人。開發(fā)者平時很多工作都類似于拿著螺絲刀擰螺絲,Copilot 就是把螺絲刀換成了電鉆,而 AI 程序員則是給開發(fā)者配個小弟,所以 Copilot 依然是個好工具,但 AI 程序員就是生產(chǎn)力,這是完全不同的兩件事。

但做 AI 程序員不是科學(xué)問題,而是個工程問題。這里涉及路徑選擇的問題,在做 AI 程序員時有公司是自己做模型,趙聰認為這是錯誤的路徑,他不相信所謂的小模型/垂直模型,覺得模型就只有大模型,因為只有大模型能帶來智力。

未來面臨的挑戰(zhàn)是,所有人都要往 project level coding 走,要依賴底層模型的進化,但模型太貴。趙聰認為GPT-4 至少得再降價 10 倍,才具有真正的可能性。

在軟件工程中,AI 難以解決的兩大問題是:1)復(fù)雜項目的業(yè)務(wù)上下文理解。2)每家公司獨特的工程架構(gòu)、邏輯和實踐。在解決這兩個問題之前,AI Agent 還無法完全替代人類程序員。

但多位從業(yè)者一致認為,隨著 AI 不斷進化,未來高級程序員不會被替代,擰螺絲的初級程序員被替代已經(jīng)能看到,未來程序員的培養(yǎng)路徑也跟現(xiàn)在不一樣,就像高科技種地,不需要真的從種地開始學(xué),而是先從學(xué)習(xí)使用工具開始。

未來 C 端應(yīng)該更好地服務(wù)普通人,而不僅僅是開發(fā)者,如果普通人也能通過 AI 實現(xiàn)編程,那么 C 端有可能完成一次爆發(fā),而這需要更強的模型能力,端到端仍然需要 Agent 來實現(xiàn)。

但可以肯定的是,未來程序員逐漸都會離不開 AI 編程工具?!咐追寰W(wǎng)(公眾號:雷峰網(wǎng))

(文中趙聰為化名)


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

代碼生成三問:如何打造 24 小時在線的 AI 程序員?

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說