丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給何思思
發(fā)送

0

對話瀾碼周健:大模型不是萬能的,也不會彎道超車丨AGI 十人談

本文作者: 何思思 2023-09-25 19:31
導(dǎo)語:不是所有問題都需要用大模型解決。

對話瀾碼周?。捍竽P筒皇侨f能的,也不會彎道超車丨AGI 十人談

作者丨何思思

編輯丨林覺民

他是亞洲首個 ACM 國際大學(xué)生程序設(shè)計競賽世界冠軍團(tuán)隊成員;

他是谷歌中文網(wǎng)站搜索質(zhì)量優(yōu)化工作的負(fù)責(zé)人;

他是AI四小龍依圖科技的第10號員工;

他是李開復(fù)50個“關(guān)門弟子”之一...

他也是瀾碼科技的創(chuàng)始人。

緣何命名為瀾碼?周健這樣說:寓意波瀾壯闊的代碼。

瀾碼科技于今年2月份在上海成立,與其他創(chuàng)業(yè)公司不同的是,瀾碼科技想做的是基于大模型打造新一代的自動化平臺。

雖然成立時間不長,但瀾碼科技已于近期完成了數(shù)千萬人民幣的A輪融資,其中IDG資本、聯(lián)新資本、Atom Capital三家參與了本次投資。

另外在產(chǎn)品層面,瀾碼科技已經(jīng)成功研發(fā)出了Agent平臺Ask XBot。AI科技評論了解到,其操作主要分為兩層,第一層由專家通過傳統(tǒng)、新興的對話交互的方式定義工作流程;第二層由一線員工通過自然語言指令,控制機(jī)器協(xié)助完成數(shù)據(jù)分析、資料調(diào)取等工作。

談及短期內(nèi)緣何能受資本如此青睞?周健告訴AI科技評論:“早期投資資方首先看的是創(chuàng)始人本身的特質(zhì),然后才是商業(yè)化能力。”

顯然這兩者方面,周健都具備。一方面,周健本人從業(yè)經(jīng)歷豐富,且瀾碼科技的核心成員均來自依圖、阿里、騰訊、Google等頭部企業(yè);另一方面,大模型技術(shù)將帶來交互方式的變革,瀾碼科技基于大模型的自動化平臺,不僅順應(yīng)了AI 2.0的發(fā)展,還符合企業(yè)以及人們生產(chǎn)生活的需要。

在瀾碼科技之前,周健也算是連續(xù)創(chuàng)業(yè)者。被問及為何選擇再次創(chuàng)業(yè)?周健表示:“前幾段創(chuàng)業(yè)經(jīng)歷給我?guī)砹撕芏囔`感,尤其是我在做CTO時,看到了很多自動化的場景,但由于AI 1.0階段AI的成本太高,有些場景很難實現(xiàn)?!?/span>

可以說,大模型的出現(xiàn)順利把AI 1.0帶入到AI2.0階段。而在這一時期成立的瀾碼科技想做的正是用新的AI技術(shù)解決之前的難題。

“很可能未來很難再次遇到像今天大語言模型這樣的宏大浪潮和機(jī)遇。”周健補充說,大語言模型的出現(xiàn),開啟了軟件新范式,過往企業(yè)數(shù)字化轉(zhuǎn)型中尚未解決或解決的不夠好的問題,今天伴隨著大語言模型的出現(xiàn),都能夠解決了。

周健過往在依圖科技和弘璣RPA的連續(xù)創(chuàng)業(yè)經(jīng)驗,使得他更知道市場需要什么。在他看來,接下來比拼的就是誰能更好的應(yīng)用大模型,就像當(dāng)初微軟使用英特爾的CPU一樣,只要應(yīng)用的好就能在大模型時代脫穎而出。”

談到未來,周健給瀾碼科技定了一個目標(biāo),即“要有挑戰(zhàn)世界第一的勇氣?!?/span>

以下是AI科技評論和周健的對話:

基于大模型創(chuàng)業(yè),比拼的是誰能更好地應(yīng)用大模型

AI科技評論:能否介紹一下您的工作經(jīng)歷?

周?。?/span>我是1999級入學(xué)上海交大,2002年拿了ACM世界冠軍,2006年碩士畢業(yè)時我拿了三個offer:一個是微軟亞洲研究院,一個是谷歌,還有一個是在上海的MSN。那個時候谷歌剛進(jìn)入中國市場,因為我有亞洲首個ACM冠軍團(tuán)隊成員的背景,對Google有宣傳效果,所以李開復(fù)說我是他的50個“閉門弟子”之一。

當(dāng)時微軟亞洲研究院的沈向洋打電話給我,我去北京和沈向洋當(dāng)面One&One,但那時我覺得谷歌更互聯(lián)網(wǎng)思維所以還是選了谷歌?,F(xiàn)在回過頭看,也還是會選谷歌。

AI科技評論:因為當(dāng)時谷歌離實踐比較近?

周健:主要是那批人都很強。當(dāng)時我的mentor 是黃崢,我旁邊坐著有宿華,還有洪鋒也都是那一屆的。

到了2008年我就進(jìn)入了阿里云,到2011年時,因為公司和自己個人多方疊加因素我離開阿里云,回到上海加入了Media V,直到2013年離職后短暫的開啟了一段創(chuàng)業(yè),再到后來我加入依圖科技和弘璣RPA。

AI科技評論:您2013年離職后,其實就開始創(chuàng)業(yè)了?

周?。?/span>是的,2013年從Media V出來時產(chǎn)生了一個錯覺,當(dāng)時hadoop在國內(nèi)火起來了,所以就打算做分析日志,做hadoop。當(dāng)時阿里用hadoop已經(jīng)有四、五年時間了,百度也用了,Media V也用了,但實際上國內(nèi)較國外還差的遠(yuǎn)。

AI科技評論:回過頭來看,您認(rèn)為不成功的原因是什么?

周?。?/span>不懂商業(yè)化,因為之前一直做純粹的技術(shù),在阿里時我是在后臺,在Media V時候雖然稍微接觸了一點業(yè)務(wù),但實際上也是純后臺,比如廣告行業(yè)的大數(shù)據(jù)分析,你不知道研發(fā)成本是多少,不知道毛利率是什么,不知道怎么定義客群,不知道產(chǎn)品的價值是什么,銷售體系也不明白,當(dāng)時就只知道日志分析是有可能會出圈的、Spark是個浪潮,這種情況下創(chuàng)業(yè)很難成功。

AI科技評論:那當(dāng)時為什么選擇創(chuàng)業(yè)?

周健:當(dāng)時見了IDG的李豐和藍(lán)馳的陳維廣,陳維廣給了我一個TS,我就被“架”上去了,所以就找了合伙人,花15萬美金建了一個三、四人的技術(shù)團(tuán)隊。但是問題也就來了:你的客戶在哪兒?你的產(chǎn)品是什么?能提供什么價值?后來發(fā)現(xiàn)4個人什么都做不了,所以8個月后就把公司關(guān)掉了。

AI科技評論:那段創(chuàng)業(yè)對您最大的影響是什么?

周?。?/span>因為有了CEO的視角,所以后來不管是看弘璣還是依圖都可以感同身受,可以更容易帶入和理解CEO的感受、壓力、困難、預(yù)判等等,相對應(yīng)地,當(dāng)你有CEO的視角再去近距離觀察別人創(chuàng)業(yè)時,能夠吸收到的經(jīng)驗也更多,體會也更深刻。這是最重要的。

另外,在創(chuàng)業(yè)的過程中我也積累了很多資源,這10年資方是看著你成長起來的,我現(xiàn)在的股東就是當(dāng)時創(chuàng)業(yè)期認(rèn)識的。

AI科技評論:再次選擇創(chuàng)業(yè)做瀾碼,又是為什么?

周?。?/span>在依圖我完整經(jīng)歷了一個技術(shù)從創(chuàng)新至普及應(yīng)用到全社會的過程,我今天選擇做基于大模型的創(chuàng)業(yè)其實是在這段經(jīng)歷中學(xué)習(xí)到的。2014年時人臉識別技術(shù)是不能用的,直到2021年人臉識別這項技術(shù)才開始實現(xiàn)大規(guī)模通用。我們原來做人臉識別,只能做一比一認(rèn)證,之后做人臉門禁、人臉閘機(jī),人臉布控,人臉?biāo)阉鞯?,主要是在工程方面做了很多“妥協(xié)”,這是我經(jīng)歷過的。

今天大語言模型從技術(shù)到商業(yè)的發(fā)展曲線也是一模一樣的,唯一的區(qū)別在于,以前依圖的算法團(tuán)隊是依圖自己組建的,這就意味著依圖要自己承擔(dān)底層模型的研發(fā)風(fēng)險,但今天眾多大語言模型公司在投資者的支持下進(jìn)行技術(shù)探索,我們用市場化的手段去購買使用就可以了,因此,瀾碼免于承擔(dān)底層大模型研發(fā)的風(fēng)險。

AI科技評論:相當(dāng)于不用承擔(dān)風(fēng)險了,只考慮怎么用大模型就好了?

周健:準(zhǔn)確地說,是我不需要負(fù)責(zé)大模型智能能力的提升,就像當(dāng)年微軟使用英特爾的CPU一樣,CPU的研發(fā)風(fēng)險由英特爾承擔(dān),而每隔一年半的時間,微軟使用到的CPU在成本相同的情況下計算能力會翻一倍,或者計算能力一樣,成本降一半。

我們現(xiàn)在是基于大模型做產(chǎn)品和商業(yè)化。做大模型產(chǎn)品,比拼的是誰能更好地應(yīng)用大模型。相當(dāng)于雖然大家都能用,但我用的好、我就是領(lǐng)先的。就像當(dāng)年微軟用英特爾,微軟用的好,微軟就把其他軟件全部滅掉了。(歡迎添加作者微信ericahss1224,交流更多國內(nèi)大模型背后的故事)

大模型的能力會持續(xù)提升,成本會持續(xù)降低

AI科技評論:選擇基于大模型做新一代的自動化平臺,是受哪段經(jīng)歷的啟發(fā)?

周?。?/span>主要是做RPA給我?guī)淼男乱暯?,現(xiàn)在我做得是人和系統(tǒng)的連接,這樣我就能把重復(fù)性的勞動問題解決。但不同的是,RPA替代的是一線業(yè)務(wù)人員重復(fù)性的工作,解決的是工作效率問題,我們今天在大語言模型下提供專家知識和經(jīng)驗,解決的是業(yè)務(wù)流程的質(zhì)量問題。

其實我做RPA時,就看到了很多自動化的場景,我知道財務(wù)有什么場景,HR有什么場景,國家電網(wǎng)有什么場景,銀行有什么場景,保險有什么場景,但由于AI 1.0階段的AI技術(shù)不成熟,成本也非常高,所以很難實現(xiàn)。

AI科技評論:具體有哪些場景?

周?。?/span>現(xiàn)在數(shù)字化程度較高的企業(yè)內(nèi)部肯定有大量的系統(tǒng),比如供電所有大量的基層單位和大量系統(tǒng)。假如供電所要換電表,起碼要涉及計量系統(tǒng)、營銷系統(tǒng)和物資系統(tǒng)三個系統(tǒng),以及六次操作。

首先要把這個電表里的數(shù)字記到系統(tǒng)里;第二,把電表拆下來,這個電表和原來電賬戶就沒關(guān)系了,要登記 ;第三,由于這個電表在物資系統(tǒng)里已經(jīng)是一個二手的物資了,還要再登記一次;第四,新電表裝上去,這個電表的ID在物資系統(tǒng)里,激活之后要把這個電表和賬戶連接起來;第五,新電表上的讀數(shù)是什么,計量系統(tǒng)里又一個開始計費的起始點,這六步操作完,還有很多復(fù)雜的工作,如果沒有RPA,是非常繁瑣復(fù)雜的。

銀行里信貸額度的審核場景也是類似。假如要做一家網(wǎng)紅飲品公司的信貸額度授信審核,首先要拿到它的財報做分析,然后要去法律系統(tǒng)里看看它是否有糾紛,把這些數(shù)據(jù)收集好,可能有40列信息,然后還要看央行規(guī)定是什么樣的,總行規(guī)定是什么樣的,都要整理好,然后做決定——是要維持授信額度不變、增加授信額度、減少授信額度還是暫停。如果沒有RPA大概40分鐘才能做一個審核。

全社會不可能有一個超級系統(tǒng),一定是要有連接的。

AI科技評論:所以AI 2.0是在解決以前不能解決的問題?

周健:對,大模型出來之后,很多以前不能實現(xiàn)的工作,都有可能實現(xiàn)了。

瀾碼科技實際上是一家AI原生的公司,我盡量不讓員工去寫軟件菜單,因為我覺得這些都是意義不大的工作,做完之后就被扔了。就像現(xiàn)在 SaaS 公司,因為要服務(wù)現(xiàn)有的客群,所以必須去做傳統(tǒng)意義的拖、拉、拽,但其實這些事情已經(jīng)沒有意義了,最后一定是對話式的UI。

AI科技評論:較AI 1.0,AI 2.0不僅技術(shù)水平提升了,也降本增效了?

周?。?/span>AI 1.0階段,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)確實把門檻降低了,但成本是非常高的,尤其是AlphaGo出來后,人力成本急速上升,再加上移動互聯(lián)網(wǎng)時代到來,拼多多、字節(jié)等大廠出現(xiàn),極大拉高了人力成本。

我在依圖時,負(fù)責(zé)依圖的研發(fā)招聘,最多的時候一年招了40個清華的學(xué)生,2016、2017年只要是AI的碩士研究生年薪就是60萬起,顯然這樣的人力成本根本賺不回來。再加上當(dāng)時的數(shù)據(jù)、算力的成本都非常高。

進(jìn)入AI2.0階段,因為有了提供大語言模型技術(shù)的公司,市場得到充分競爭,使得每隔一年成本一樣的情況下,大模型的智能水平肯定會翻一倍,反過來智能水平一樣的情況下,成本會降到原來的二分之一到三分之一。

AI科技評論:瀾碼現(xiàn)在主要服務(wù)哪些客戶群體?

周?。?/span>獵頭招聘是主攻場景之一。初級獵頭搜候選人主要通過獵聘、脈脈、BOSS直聘等,有3、4年工作經(jīng)驗的獵頭可能不需要了,因為他們都會有一個候選人私域庫,大概2000人左右,這2000人平均每兩、三年要換一次工作,這部分信息的更新是一個很大體量的工作。

此外,獵頭顧問基于私域庫尋找候選人的工作方式,對顧問來說準(zhǔn)確率高,工作量也小,但是很難把打電話溝通或見面溝通時有價值的數(shù)據(jù)補充到私域庫中,只能在私域庫自己去打標(biāo)簽,比如今天和候選人打電話說了啥,當(dāng)時自己記下來了,但時間一長就忘了,私域庫的管理效率和質(zhì)量都不高。

大模型出來后,騰訊會議之類的軟件有了語音識別的功能,就可以把打電話溝通等交互過程中的“活”數(shù)據(jù)整理、提煉、存檔,這些都是大模型賦予的能力。

大模型催生了第四個新的范式,可以叫對話式或者匹配式?,F(xiàn)在的獵頭工作是人崗匹配,抽象來說就是一個X space,x空間和y空間。x空間描述需求,y空間匹配需求。

大模型出來之后,對話的方式可以提高匹配效率,這是很典型的場景,也在更多其他場景適用,比如房產(chǎn)中介搜房源,設(shè)計師搜圖,外包程序員搜函數(shù)、代碼等。

AI科技評論:相當(dāng)從獵頭這個場景出發(fā),先做了一個工具試試?

周?。?/span>其實最終語義的匹配肯定是一個大的場景,這個場景在所有專業(yè)場景、企業(yè)里都能用到。我們只是把獵頭作為其中一個突破口而已,我們還有一個戰(zhàn)略合作伙伴,屬于行業(yè)Top3級別,營收在5億左右,我現(xiàn)在已經(jīng)在幫他做運營的工具。

我們之前也服務(wù)過金山辦公,WPS中Excel表格就是我做的,比如說“請一班學(xué)生成績前十名的家長,明天下午 2 點到辦公室?!边@是一個很復(fù)雜的需求,原來需要你在表格里面查詢、檢索,再去微信找人、發(fā)信息,現(xiàn)在有了大模型就很容易智能化地處理了。

大模型不是萬能的,技術(shù)研發(fā)也不存在彎道超車

AI科技評論:作為應(yīng)用方,瀾碼怎么和大模型合作?

周?。阂驗榇竽P偷摹盎糜X問題”和權(quán)限問題,終端用戶或者甲方很難和大模型直接合作,肯定是需要瀾碼科技這樣的中間廠商。

以獵頭場景為例,比如找阿里P9級的35歲的員工,如果沒有,放寬到38歲,有三個。那是應(yīng)該優(yōu)先問38歲,還是阿里系、還是P9,這是專業(yè)知識的范疇了。

在我看來,現(xiàn)在的大模型是一個重要的模塊,如果用OpenAI的說法就是,Agent底下有一個領(lǐng)域模型。比如識別簡歷中的985、211高校這樣的信息,需要用大模型訓(xùn)練嗎?其實不需要,所以大模型不是萬能的,很多事情不需要、也不應(yīng)該用大模型來做。

AI科技評論:國內(nèi)外的大模型,都有用過嗎?

周?。?/span>沒必要把所有的大模型都用一遍,只需要用目前水平最高的模型就夠了。所以我們是在用GPT 4做訓(xùn)練。比如我有10個問題,我會讓GPT 4 幫我破解這10個問題,破解完我再讓 GPT 4 幫我確認(rèn)答案、評價答案,然后訓(xùn)練出一個小模型,解決場景問題。

AI科技評論:怎么保障隱私問題?畢竟這個問題還是很敏感的。

周?。?/span>個人隱私保護(hù)法規(guī)定數(shù)據(jù)簡歷不能隨便出境,所以我會把姓名、電話、年齡這些涉及個人隱私的問題摘出來,只把院校、項目經(jīng)歷給大模型,相當(dāng)于一個表,我只給了表頭的內(nèi)容,表里的內(nèi)容我不會給出去。

AI科技評論:目前,國內(nèi)大模型還是非常火熱的,您怎么看?

周?。?/span>AI新聞和AI不是一件事兒,一個創(chuàng)業(yè)公司不可能一開始就做千億參數(shù)的模型,因為這件事情非常燒錢,完全沒必要。應(yīng)該循序漸進(jìn),先訓(xùn)練一個6B的,再訓(xùn)個13B的,再訓(xùn)個33B的...不見得真的這樣,但是過程肯定是這樣的。

智譜、MiniMax很早就開始做這件事情了,所以他們能取得現(xiàn)在的成績是在意料之中的。但是有些公司未必走過這個技術(shù)路線,但對他們來說,不可能先發(fā)一個13B的模型,他只能說我已經(jīng)有千億模型了,但實際上水平還沒達(dá)到。(歡迎添加作者微信ericahss1224,交流更多國內(nèi)外大模型背后的故事)

AI科技評論:所以國內(nèi)的模型水平還很難趕超OpenAI?

周?。?/span>這個問題和行業(yè)人士探討過,如果想做GPT4起碼需要25000張卡、訓(xùn)練8個月的時間。從目前來看,國內(nèi)大模型的水平不可能比OpenAI強,大模型是不存在彎道超車的。

創(chuàng)業(yè)是九十九死一生的事情,要有挑戰(zhàn)世界第一的勇氣

AI科技評論:較之前,您認(rèn)為現(xiàn)在創(chuàng)業(yè)哪些東西是最重要的?或者和之前有什么不一樣?

周?。?/span>我覺得沒成功之前很難說這句話,因為創(chuàng)業(yè)是 99 死一生的事情,每次創(chuàng)業(yè)的環(huán)境不一樣。我在依圖經(jīng)歷過40億美金,弘璣也達(dá)到過6、7億美金,如果現(xiàn)在我只做二、三十億,或者兩三億美金被收購了,對我來說沒有任何意義。如果做到10億美金上市的話,算是及格。

很可能以后很難再遇到這樣的浪潮了,這輩子如果有沖百億的機(jī)會,我肯定會沖百億,有千億我也肯定會take risk,最后很可能就是大賭大輸大贏,小賭小輸小贏。

AI科技評論:作為初創(chuàng)企業(yè),瀾碼的優(yōu)勢是什么?

周?。?/span>其實現(xiàn)在是在用未來的技術(shù)解決過去的問題。過去的從業(yè)經(jīng)驗使得我能很好的利用大模型的優(yōu)勢,再就是市場端我早就探索過了,我知道今天市場需求是什么樣的,我也知道他們付費的意愿。

但也有一個難題,是排序的問題——我應(yīng)該先解決哪個問題、再解決哪個問題。反過來,大模型遲早會突破,所以你的目光只要足夠遠(yuǎn),你等著它突破就好了。

AI科技評論:瀾碼以后的規(guī)劃是什么樣的?

周?。?/span>我給瀾碼訂的目標(biāo)是要有挑戰(zhàn)世界第一的勇氣。

我們的目標(biāo)是做企業(yè)的入口,到時候企業(yè)不用登陸SaaS,因為我是對話式搜索,只需要和我講你的需求,比如我要請假,我要報銷,我要分析某個門店的情況,只需要講就行了。

五、六年前我寫過一篇文章說,我想做一個行星級的智慧系統(tǒng),那時就看到了一個技術(shù)趨勢說摩爾定律要停了,這就意味著技術(shù)的每一層芯片層、操作系統(tǒng)、數(shù)據(jù)庫可能都會發(fā)生變化,只不過今天以這種形式表現(xiàn)出來了。

本文作者:何思思,微信ericahss1224。長期關(guān)注國內(nèi)外各企業(yè)在AIGC、大模型及應(yīng)用層方面的動向,歡迎添加作者微信互相交流、互通有無。

(雷峰網(wǎng)雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))






雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

工業(yè)口編輯

關(guān)注新基建,聚焦工業(yè)互聯(lián)網(wǎng)領(lǐng)域 網(wǎng)絡(luò)安全丨微信:15230152798
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說