0
本文作者: 何思思 | 2023-12-06 17:45 |
作者丨何思思
編輯丨陳彩嫻
“艱苦奮斗,獨(dú)立自主”——這是昆侖萬維董事長(zhǎng)兼CEO方漢做大模型3年以來的真實(shí)感受。
早在今年4月,昆侖萬維就發(fā)布首款千億級(jí)參數(shù)大模型“天工”,是國內(nèi)最早一批擁有大模型的企業(yè)之一;今年8月,昆侖萬維更是推出了國內(nèi)首個(gè)融合了大模型能力的搜索引擎——天工AI搜索。
作為一家以游戲得名,后來發(fā)展成為國內(nèi)互聯(lián)網(wǎng)平臺(tái)的出海企業(yè),昆侖萬維曾相繼并購孵化了包括Opera、StarMaker等在內(nèi)的多款現(xiàn)象級(jí)應(yīng)用。
然而從游戲互聯(lián)網(wǎng)公司到大模型,終究不是一步簡(jiǎn)單的跨越?!皬挠螒虻匠龊T俎D(zhuǎn)做大模型,是一個(gè)如此大的跨界,底氣在哪兒?能做成嗎?還是在搶噱頭?”
方漢對(duì)AI科技評(píng)論表示,其實(shí)昆侖萬維對(duì)大模型的研究遠(yuǎn)比想象中要早得多,時(shí)間回到2020年,這一年ChatGPT還沒有火,但當(dāng)時(shí)昆侖萬維就押注了AIGC賽道。
談及為何先于ChatGPT出圈前,就入局大模型賽道?
方漢告訴AI科技評(píng)論:在外界看來跨度很大,但理由是很充分的。首先和公司的業(yè)務(wù)相關(guān),昆侖萬維在海外主要主要做內(nèi)容平臺(tái),包括音樂、社交、游戲、動(dòng)漫等,這意味著我們對(duì)任何一項(xiàng)技術(shù)變革都是非常敏銳的。另外還一個(gè)重要的原因是,較元宇宙、VR來說,AIGC和相關(guān)產(chǎn)品的結(jié)合,能更容易地覆蓋更多的普通人群。
2022年春節(jié),昆侖萬維內(nèi)部提出“All in AIGC”的口號(hào),同年年底發(fā)布了開源項(xiàng)目。
時(shí)間來到2023年,此時(shí)大模型在國內(nèi)蓬勃發(fā)展,昆侖萬維也加快了大模型以及相關(guān)產(chǎn)品的研究進(jìn)度。大模型層面,4月份發(fā)布了“天工”大模型,產(chǎn)品應(yīng)用層面,初步形成包括 AI大模型、AI搜索、AI游戲、AI社交、AI音樂、AI動(dòng)漫等六大方向在內(nèi)的 AI業(yè)務(wù)矩陣。
值得注意的是,從入局時(shí)間來看,昆侖萬維要早于國內(nèi)大部分企業(yè),這也從側(cè)面說明了昆侖萬維在大模型這條新賽道上并非坦途。
“我們沿著GPT的路線辛辛苦苦做了3年,但這些苦難也鍛煉了我們獨(dú)立解決問題和處理問題的能力,我們把這段經(jīng)歷總結(jié)為‘艱苦奮斗,獨(dú)立自主’?!狈綕h笑著說道。
除了研發(fā)通用大模型,專有模型以及上層應(yīng)用外,方漢更是將開源的基因融入其中,基于天工大模型,昆侖萬維選擇開源了「天工」Skywork-13B系列大模型。
面對(duì)開源與閉源之爭(zhēng),方漢表示,兩者并不矛盾,互為有機(jī)組成部分,開源的本質(zhì)是為了構(gòu)建良好的生態(tài),讓更多中小企業(yè)能夠在大模型基礎(chǔ)上開展一些工作。
“昆侖萬維的體量相對(duì)較小,所以我們對(duì)大模型的研究會(huì)朝著離應(yīng)用更近的方向發(fā)展,”之于未來在大模型方面的規(guī)劃,方漢如是說。
以下為AI科技評(píng)論和方漢的對(duì)話:
跨界:不是為了股價(jià),而是業(yè)務(wù)發(fā)展所需
AI科技評(píng)論:從游戲到出海,再到大模型,為什么要跨這么大的界?
方漢:在外界看來跨度很大,但其實(shí)理由是很充分的。
首先和公司業(yè)務(wù)有關(guān)。做游戲之前,我們是在海外做用戶增長(zhǎng)的,而且在這方面有豐富的經(jīng)驗(yàn)。上市時(shí)我們就有了一個(gè)判斷,我們的增長(zhǎng)能力大多在網(wǎng)游端,但當(dāng)時(shí)我們也在想是不是可以把這種能力賦能到別的互聯(lián)網(wǎng)品牌上,因?yàn)槲覀冎乐袊嗽诤M庾鲆粋€(gè)新的廠牌其實(shí)有難度的,所以我們就買了Grindr,把用戶量做大了五倍;然后買了StarMaker,用戶量從2000人做到了大概近千萬的日活。我們收購Opera后孵化出了三個(gè)產(chǎn)品,一是Opera News,目前是非洲最大的客戶端;二是OPay,非洲的支付平臺(tái);三是Opera GX Browser,目前在歐美地區(qū)月活達(dá)到3000萬。所以我們?cè)诤M庾銎脚_(tái)增長(zhǎng)的經(jīng)驗(yàn)非常豐富。
另外,我們?cè)诤M庾龅氖莾?nèi)容平臺(tái),包括音樂、社交、游戲、動(dòng)漫等,這就意味我們對(duì)任何一項(xiàng)技術(shù)變革都是非常關(guān)注的。還有一個(gè)原因,較元宇宙、VR來說,AIGC更容易覆蓋更多普通人群。為什么呢?當(dāng)時(shí)雖然ChatGPT還沒出來,但是抖音上的換臉玩法已經(jīng)出來了,其實(shí)背后都是AI技術(shù)的支撐,只是沒有現(xiàn)在這么明顯而已。
當(dāng)時(shí)我們還做了一個(gè)測(cè)試:一塊手表的重量是70克,手機(jī)是300克到400克,但當(dāng)時(shí)的VR設(shè)備大概在一斤半左右,所以以我們當(dāng)時(shí)的看法,認(rèn)為VR賽道很難做起來,因?yàn)閷?shí)在太重了。元宇宙則是另外一個(gè)邏輯,我們認(rèn)為元宇宙在人和人溝通的效率方面實(shí)際上比不上線下見面,所以我們認(rèn)為元宇宙也不會(huì)有很大的市場(chǎng)。
但AI就不一樣了,目前90%的美國大學(xué)生都在使用ChatGPT做作業(yè),國內(nèi)很多電商基本上都在用AIGC生成商品圖片。這一波AI對(duì)普通人的滲透遠(yuǎn)比我們想象得要大的多。所以我們認(rèn)為AIGC和之前的互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)兩波浪潮一樣,會(huì)是一個(gè)大的技術(shù)變革,我們就決定投入了。
AI科技評(píng)論:什么時(shí)候決定全方位投入的?
方漢:2020年GPT3出來時(shí),我們就很快地意識(shí)到了AIGC會(huì)是一個(gè)非常大的里程碑。2021年開始鋪算力,并訓(xùn)練出了一個(gè)140億參數(shù)的大模型,同時(shí)組建了一個(gè)專門做音樂生成的團(tuán)隊(duì);2022年春節(jié),內(nèi)部開了戰(zhàn)略會(huì),提出了All in AIGC的口號(hào);2022年年底12月份,疫情剛放開時(shí),我們就發(fā)布了開源項(xiàng)目,其實(shí)當(dāng)時(shí)ChatGPT還沒有火,對(duì)于像我們這樣一個(gè)中等體量的互聯(lián)網(wǎng)公司來說,我們做的事情要比業(yè)界同行稍微早一些。
AI科技評(píng)論:最初瞄準(zhǔn)的就是AGI嗎?
方漢:首先,我們跟進(jìn)大模型這件事,完全不是為了股價(jià)。因?yàn)锳GI和AIGC是兩碼事,所以當(dāng)時(shí)只想到了AIGC對(duì)我們公司業(yè)務(wù)的發(fā)展非常重要。包括我們現(xiàn)在設(shè)立的音樂、漫畫、社交、游戲等方向,都是我們的傳統(tǒng)產(chǎn)品,只有AI搜索算是和大模型結(jié)合后的一個(gè)新發(fā)現(xiàn)。
當(dāng)然,天工大模型是通用大模型,但是想要在每個(gè)行業(yè)落地,還要在對(duì)應(yīng)的專有模型上做應(yīng)用,所以在天工大模型這個(gè)底座之上,還訓(xùn)練出了3D生成模型,圖像生成模型、視頻生成模型,音樂生成模型等專有模型。
入局大模型:沒有參考,只能獨(dú)立自主
AI科技評(píng)論:最初選擇的是Bert路線還是GPT路線?早期國內(nèi)大部分企業(yè)可能都是基于Bert做研究的。
方漢:我們最初選擇的就是GPT路線,當(dāng)時(shí)沒有任何開源框架可以參考,所以我們是沿著GPT的路線辛辛苦苦做了3年。在國內(nèi)廠商里是相對(duì)非常早期的。(更多關(guān)于大模型行業(yè)的故事,歡迎添加微信 ericahss1224,互相交流,互通有無)
AI科技評(píng)論:這個(gè)過程中有什么困難點(diǎn)嗎?畢竟起步確實(shí)太早了。
方漢:2020年剛開始做的時(shí)候,確實(shí)挺辛苦的。因?yàn)闆]有任何可以參考的內(nèi)容,而且當(dāng)時(shí)國內(nèi)大部分企業(yè)走的是Bert路線,GPT路線的人不好找,所以只能根據(jù)一些公開文獻(xiàn)從頭研究。
但這樣也鍛煉了我們獨(dú)立解決問題和處理問題的能力,我們把這段經(jīng)歷總結(jié)為“艱苦奮斗,獨(dú)立自主?!币詳?shù)據(jù)處理團(tuán)隊(duì)為例,從2020年搭建到現(xiàn)在,應(yīng)該是國內(nèi)最老牌、最成熟的團(tuán)隊(duì)了。
AI科技評(píng)論:現(xiàn)在很多企業(yè)都在強(qiáng)調(diào)數(shù)據(jù)的量和質(zhì)量,對(duì)于昆侖來說,數(shù)據(jù)是最難攻克的一關(guān)嗎?
方漢:數(shù)據(jù)處理肯定是一個(gè)難點(diǎn)。對(duì)于大模型訓(xùn)練來說,數(shù)據(jù)質(zhì)量的重要性往往高于數(shù)據(jù)的量,因?yàn)閿?shù)據(jù)很容易收集,但高質(zhì)量的數(shù)據(jù)很難。
比如,中國擁有全世界最大的中小學(xué)生題庫,但這個(gè)題庫你直接問題大模型質(zhì)量是很差的,因?yàn)轭}庫中的數(shù)據(jù)沒有經(jīng)過標(biāo)準(zhǔn)化和格式化的處理。所有公式可能都是圖片文件,這就要把這些公式全部轉(zhuǎn)成文本可描述的文件。這就要花很長(zhǎng)時(shí)間才能完成。像中國可能有兩億道中小學(xué)生題庫,處理完了之后質(zhì)量高的可能不到一千萬道,這是一個(gè)很辛苦的數(shù)據(jù)處理過程。當(dāng)然這個(gè)過程也會(huì)涉及到數(shù)據(jù)清洗、加工、重新整理。最麻煩的是針對(duì)質(zhì)量不好的數(shù)據(jù),要想辦法寫工具,把質(zhì)量變好,甚至要雇一批數(shù)據(jù)標(biāo)注人才把數(shù)據(jù)標(biāo)好,這是相當(dāng)麻煩且繁瑣的工作。
另外,在數(shù)據(jù)層面,最重要的不是數(shù)據(jù)加工的能力而是數(shù)據(jù)生產(chǎn)的能力,目前很多數(shù)據(jù)是空白的,尤其是在一些很窄的領(lǐng)域,所以必須生產(chǎn)出來。以音樂數(shù)據(jù)為例,全世界每年能夠生產(chǎn)3億首,其中中國每年就能生產(chǎn)200萬首歌,但實(shí)際上可能只有20萬首是標(biāo)注好的,那怎么辦?只能自己花錢加工數(shù)據(jù)。所以現(xiàn)在質(zhì)量高的數(shù)據(jù)是非常稀缺的。
AI科技評(píng)論:其實(shí)數(shù)據(jù)層面,也會(huì)涉及到數(shù)據(jù)合規(guī)的問題?
方漢:首先要有一個(gè)正確的心態(tài),我們一直認(rèn)為數(shù)據(jù)合規(guī)和法律監(jiān)管是行業(yè)健康發(fā)展的前提,所以我們一開始就會(huì)配合各部門完成數(shù)據(jù)保護(hù)等工作,這是最關(guān)鍵的。我們認(rèn)為有監(jiān)管比沒監(jiān)管好,如果沒有監(jiān)管的話,各種不健康不合規(guī)的東西出來了,行業(yè)的發(fā)展會(huì)受限制,企業(yè)的損失也會(huì)很慘重。
在出海過程中,中國一些企業(yè)就是因?yàn)椴恢匾暫弦?guī),出現(xiàn)了各種各樣的問題。對(duì)于大模型訓(xùn)練來說也是一樣的,最關(guān)鍵的是敏感數(shù)據(jù)不能出境。
我們?cè)跂|南亞、歐洲等地區(qū)發(fā)展好的原因就在于我們堅(jiān)決服從監(jiān)管,而且最大限度地配合監(jiān)管部門做事。國內(nèi)也一樣,我們是全國第二家提交大模型審核的企業(yè),北京市第二批通過的。
其實(shí)AI這波數(shù)據(jù)保護(hù)法規(guī),各國還在規(guī)劃中。我們也在緊密關(guān)注,會(huì)全力配合。中國是大模型落地比較早的國家,所以我們配合得非常好。其他國家可能還沒有完全落地,但我們?cè)诔掷m(xù)關(guān)注。
AI科技評(píng)論:美國的持續(xù)封鎖,會(huì)不會(huì)有算力方面的擔(dān)憂?
方漢:肯定會(huì)有影響?,F(xiàn)在業(yè)界出現(xiàn)了兩個(gè)新的摩爾定律,一是,出自O(shè)penAI——每18個(gè)月人類的知識(shí)會(huì)翻倍,我對(duì)此表示質(zhì)疑;
二是,大模型的訓(xùn)練和推理成本會(huì)以每年10倍的速度遞減,也就是說每年的訓(xùn)練成本和推理成本會(huì)下降10倍左右,我表示贊同。為什么?因?yàn)楝F(xiàn)在所有人都在拼命優(yōu)化,也出現(xiàn)了很多新的理論,比如最早的文生圖基本15分鐘才能完成,現(xiàn)在4、5秒就能完成了,直接降了60倍。
另外,手機(jī)上現(xiàn)在已經(jīng)能跑7B、13B的模型了,5年之后手機(jī)上一定能跑80B的模型,所以最后離線推斷一定會(huì)成為主流。
AI科技評(píng)論:現(xiàn)在國內(nèi)很多企業(yè)還是有算力方面的擔(dān)憂的,國內(nèi)有可替代的嗎?
方漢:華為910B幾乎能達(dá)到A100 85%的性能,主要問題在于他的底層軟件的穩(wěn)定性和硬件的兼容性還在不斷修補(bǔ)中,但是用作推理已經(jīng)沒有任何問題了,訓(xùn)練還差一點(diǎn),還需要大家陪著它再改一段時(shí)間。
國內(nèi)能夠達(dá)到910B水平的一共只有兩三家,但是國產(chǎn)芯片最大的問題是產(chǎn)能,只要產(chǎn)能上去了,肯定能替代。國內(nèi)芯片在設(shè)計(jì)上一點(diǎn)也不落后,和A100的差距已經(jīng)不大了,H100和H200還需要時(shí)間追趕。(更多關(guān)于大模型行業(yè)的故事,歡迎添加微信 ericahss1224,互相交流,互通有無)
面對(duì)競(jìng)爭(zhēng):差異化是前提,其次是認(rèn)知
AI科技評(píng)論:相對(duì)于其他五款產(chǎn)品來說,AI搜索是新產(chǎn)品,為什么選擇搜索這個(gè)方向?
方漢:很簡(jiǎn)單的邏輯。AI搜索不是憑空產(chǎn)生的,是舊的技術(shù)和大模型技術(shù)結(jié)合后推出的新產(chǎn)品。
其實(shí)我們做搜索已經(jīng)有6年的時(shí)間了。在這方面的技術(shù)儲(chǔ)備遠(yuǎn)比想象的多,早期我們做Opera News,它的背后其實(shí)是有一個(gè)搜索引擎支撐的,這個(gè)搜索引擎每天可能要收集幾千萬個(gè)英文的站點(diǎn),把新聞抓取下來然后轉(zhuǎn)成用戶可以訪問的,就像今日頭條一樣。所以AI搜索反而是最早ready的。
AI科技評(píng)論:除了AI搜索,還有游戲、社交、音樂等產(chǎn)品,這些產(chǎn)品的推出節(jié)奏是什么樣的?
方漢:基本會(huì)跟用戶的節(jié)奏走,我們會(huì)在用戶端不斷地測(cè)試,一旦我們認(rèn)為測(cè)試效果、數(shù)據(jù)和用戶的反饋達(dá)標(biāo)了,就會(huì)推出來。目前除了AI搜索外,AI音樂、AI動(dòng)漫、AI社交和AI游戲等產(chǎn)品都在海外市場(chǎng)測(cè)試中。
AI科技評(píng)論:可以理解為AI搜索主要面向國內(nèi),其他產(chǎn)品面向海外?
方漢:其他五款產(chǎn)品在海外落地成功后,會(huì)考慮在國內(nèi)進(jìn)行推廣。
首先全世界付費(fèi)習(xí)慣最好的市場(chǎng)是歐美,其次是中國。我們首選歐美市場(chǎng),因?yàn)闅W美用戶的付費(fèi)習(xí)慣比較好,目前OpenAI付費(fèi)最多的用戶也集中在歐美市場(chǎng)。所以會(huì)選擇先做價(jià)值較大的市場(chǎng)。
AI科技評(píng)論:其實(shí)現(xiàn)在各大廠都在做產(chǎn)品的重構(gòu),昆侖在這方面有什么不同?
方漢:大家的思路不同,我們一直在做面向C端的端到端的內(nèi)容生產(chǎn)方。
其實(shí)從去年我們就一直在思考大模型之后是什么,當(dāng)時(shí)我們就預(yù)判了肯定是千模大戰(zhàn),但是在這場(chǎng)戰(zhàn)役中,我們不一定能勝出。所以我們就想清楚了,不做效率工具,只做平臺(tái)。這個(gè)事情其實(shí)比大家想的要早一點(diǎn)。
AI科技評(píng)論:關(guān)于C端,大家都在討論超級(jí)應(yīng)用,您認(rèn)為距離下一個(gè)超級(jí)應(yīng)用,還有多長(zhǎng)時(shí)間?
方漢:肯定有超級(jí)應(yīng)用,但不止一個(gè)超級(jí)應(yīng)用,互聯(lián)網(wǎng)時(shí)代誕生了谷歌、亞馬遜、Meta(Facebook),移動(dòng)互聯(lián)網(wǎng)催生了Snapchat、Twitter,包括國內(nèi)的字節(jié)、美團(tuán)、滴滴等都是超級(jí)APP,但沒有一個(gè)超級(jí)app能把所有超級(jí)APP集合起來。所以我認(rèn)為一個(gè)超級(jí)APP包打天下是不太可能的,未來可能會(huì)出現(xiàn)幾個(gè)超級(jí)APP。
聚焦到具體的領(lǐng)域,游戲和電影一樣不太可能出現(xiàn)超級(jí)APP,社交、音樂、動(dòng)漫等都有可能。
AI科技評(píng)論:關(guān)于C端,大家都在討論超級(jí)應(yīng)用,您有信心嗎?
方漢:信心肯定得有,我也相信我們一定能做出超級(jí)APP。因?yàn)槲覀冏龅谋容^早,希望也比較大,但誰也不敢保證100%一定能做成,畢竟機(jī)緣巧合的事情太多了。只能說我們會(huì)盡力朝著超級(jí)APP的方向努力,所以我們一直做平臺(tái),不做工具。因?yàn)樽龉ぞ呤亲霾怀沙?jí)APP的。
大模型形態(tài)之爭(zhēng):開源是大趨勢(shì)
AI科技評(píng)論:除天工外,昆侖還開源了13B模型,好像很多廠商都喜歡把6B、7B或者13B作為一個(gè)節(jié)點(diǎn)?
方漢:其實(shí)邏輯很簡(jiǎn)單,和顯存相關(guān)。4090消費(fèi)級(jí)顯卡的內(nèi)存是24G,6B需要12G,13B需要26G左右。所以6B和13B都是消費(fèi)級(jí)顯卡,大家可以直接拿回去玩,或者供小企業(yè)使用,因?yàn)橄M(fèi)級(jí)顯卡特別便宜。為什么A100、H100性能高,因?yàn)橐粋€(gè)是40G內(nèi)存,一個(gè)是120G,單卡多少G的內(nèi)存是非常關(guān)鍵的。
這就是為什么蘋果新一代筆記本特別強(qiáng)的原因,因?yàn)樗芘艿?96G。所以最新版本的蘋果電腦理論上可以跑一個(gè)300B的模型,只是慢一點(diǎn)而已。
AI科技評(píng)論:那為什么參數(shù)大的模型會(huì)選擇閉源?是商業(yè)化方面的考慮?
方漢:因?yàn)榇蟛糠秩硕寂懿黄饋?,你說是為了商業(yè)化考慮嗎?任何一家大模型企業(yè)都要考慮商業(yè)化,這是一件非常正常的事情。實(shí)際上最重要的還是底座大模型,一個(gè)千億級(jí)別的大模型對(duì)我們而言,最關(guān)鍵的是技術(shù)機(jī)密。在這之上訓(xùn)練出很多小模型開源給大家使用,完全是沒問題的。
AI科技評(píng)論:昆侖為什么要選擇開源?怎么看待開源和閉源的關(guān)系?
方漢:我認(rèn)為開源的話,做生態(tài)比較容易,對(duì)中小企業(yè)的機(jī)會(huì)也會(huì)更大。
開源和閉源并不矛盾,二者互為有機(jī)組成部分。這和做開源公司的leader的商業(yè)模式有關(guān)。
就像Meta(Facebook)屬于后來的攪局者,對(duì)他來說,他不依靠大模型,對(duì)他的業(yè)務(wù)也沒有致命性的影響,所以他就直接開源了,所以現(xiàn)在開源模型最好的是Meta的LLaMA 2。
目前國內(nèi)大模型還處在誰先發(fā)完全開源的大模型,大家一擁而上的狀態(tài)。我們?nèi)ツ?2月份發(fā)布大模型之后,利用我們的大模型做研發(fā)的企業(yè)特別多。我覺得這是很正常的事。
但我認(rèn)為開源的本質(zhì)是為了構(gòu)建一個(gè)良好的生態(tài),讓更多的中小企業(yè)能夠在我們的大模型上開展一些工作。
AI科技評(píng)論:現(xiàn)在老生常談的一個(gè)話題是,開源怎么掙錢?
方漢:做開源的話,一開始大家確實(shí)不知道怎么掙錢。其實(shí)開源怎么變現(xiàn)已經(jīng)有一套很成熟的邏輯了。最近MongoDB提出了一個(gè)新的邏輯SSPL,他說我開源出來,你可以隨便用,不用給我交錢。但是云廠商不能用這個(gè)給別人提供服務(wù)。包括百度、阿里、亞馬遜等云廠商,如果要給別人提供服務(wù)的話,必須付費(fèi)。
但是因?yàn)樵朴?jì)算是一個(gè)大的趨勢(shì),大家都希望云廠商來提供服務(wù)。MongoDB的說法是云廠商不許用,只能我來提供云服務(wù),相當(dāng)于把云服務(wù)的版權(quán)卡死了。只有他們能夠提供這項(xiàng)服務(wù),這樣就會(huì)很掙錢,像MongoDB每年都有幾十億的營(yíng)收。(更多關(guān)于大模型行業(yè)的故事,歡迎添加微信 ericahss1224,互相交流,互通有無)
AI科技評(píng)論:內(nèi)部產(chǎn)品是在天工閉源大模型上做的,還是在開源模型上做的?
方漢:是在天工底座大模型之上,裁剪出的各種專有小模型上研發(fā)的。
大模型落地:早期蓬勃發(fā)展,且雜亂
AI科技評(píng)論:您認(rèn)為大模型想要落地難嗎?
方漢:大模型在B端的落地速度會(huì)非常快。因?yàn)橛行〣端企業(yè),尤其是國企、世界500強(qiáng)企業(yè)的付費(fèi)習(xí)慣極好。很多人說大模型能不能在B端掙錢,就看微軟的股價(jià)什么時(shí)候漲。因?yàn)楝F(xiàn)在全世界做B端生意的,微軟是走的最好的。
國內(nèi)的話,要看怎么激發(fā)用戶的痛點(diǎn),比如我們做商品圖片生成,目前很多小企業(yè)、淘寶商家的付費(fèi)意愿都很強(qiáng),因?yàn)樗麄冋姨詫毮L嘏囊粡埳唐穲D片的成本可能是200塊錢到500塊錢,AIGC 2塊錢到5塊錢就能解決,所以淘寶模特和攝影師未來肯定會(huì)失業(yè)。
AI科技評(píng)論:所以不存在大模型商業(yè)化落地難的問題了?
方漢:當(dāng)然存在,因?yàn)楝F(xiàn)在大模型的能力遠(yuǎn)遠(yuǎn)不夠,他能幫用戶解決的問題也是有限的。
為什么淘寶的商品圖片生成會(huì)率先被打破,比如一個(gè)身穿大衣的模特,多了根手頭,少了根手指頭,用戶是能容忍的,只要簡(jiǎn)單地修一下就可以了。但如果是法律問題,你告訴我這個(gè)人應(yīng)該從判3年改到判10年,這就是一個(gè)大問題了。所以想要在金融、法律、醫(yī)療等比較嚴(yán)肅的行業(yè)落地還是有難度的。內(nèi)容賽道就比較容易了,比如漫畫畫錯(cuò)了就畫錯(cuò)了,大家在這方面的容忍度還是很高的。
現(xiàn)在大模型商業(yè)化還處在早期蓬勃發(fā)展且比較混亂的階段,但這是任何一項(xiàng)新技術(shù)發(fā)展的必經(jīng)之路,如果一開始不雜亂的話,怎么能優(yōu)勝劣汰出現(xiàn)一批真正優(yōu)秀的公司呢。所以說這是一個(gè)很正常的現(xiàn)象。
AI科技評(píng)論:您認(rèn)為哪些行業(yè)比較容易落地,哪些困難?
方漢:容錯(cuò)率低的行業(yè)最難進(jìn),容錯(cuò)率高的行業(yè)很容易進(jìn)。
AI科技評(píng)論:三年以來,對(duì)大模型有沒有一個(gè)改觀?
方漢:大模型的智能能力越來越強(qiáng),這是我們一開始想不到的,但我認(rèn)為還有很多所謂的局限性。比如智能程度沒有那么高,最難的像3D模型的生產(chǎn)、以及視頻生成技術(shù)還沒有完全解決。
我們堅(jiān)信未來一定會(huì)解決,但對(duì)于中小企業(yè)來說,不能等這些問題都解決了再研發(fā)產(chǎn)品,而是要提前做好準(zhǔn)備。
AI科技評(píng)論:怎么平衡天工大模型和上層AI產(chǎn)品的關(guān)系,未來會(huì)有所側(cè)重嗎?
方漢:首先一個(gè)是基礎(chǔ)架構(gòu),一個(gè)是上層應(yīng)用,沒有所謂的偏重。
目前大部分應(yīng)用廠商沒有自己的大模型,只能調(diào)用別人的API,這就會(huì)出現(xiàn)很多風(fēng)險(xiǎn)。比如出現(xiàn)問題時(shí)只能先向上反應(yīng),等別人來改。再比如LLaMA是一個(gè)英文模型,它的中文語料不夠,所以想要做中文的很難。
好處在于,從大往小做容易。我們能基于底座大模型定制各類行業(yè)模型,加上對(duì)大模型有著深刻的認(rèn)知和理解,也能加快做行業(yè)模型的進(jìn)度,無論這個(gè)模型的質(zhì)量是不是行業(yè)內(nèi)最好的。
AI科技評(píng)論:未來競(jìng)爭(zhēng)會(huì)愈演愈烈,怎么保持競(jìng)爭(zhēng)優(yōu)勢(shì)?
方漢:我們公司相對(duì)比較小,部門間的溝通會(huì)比較多。所以我們對(duì)于大模型的研究會(huì)朝著離應(yīng)用更近的方向運(yùn)行。
大模型的未來:端側(cè)推理將成為下一個(gè)爆發(fā)點(diǎn)
AI科技評(píng)論:目前國內(nèi)大模型的發(fā)展歸于平淡了,您怎么看?
方漢:很大程度上是因?yàn)樗懔Τ跃o。訓(xùn)練GPT-3.5只需1000張卡,GPT-4需要5000張卡起步。GPT-5估計(jì)要3萬張卡左右。算力不夠很難訓(xùn)出下一代模型。這是很實(shí)際的問題。
所以以前是千模大戰(zhàn),現(xiàn)在已經(jīng)變成百模大戰(zhàn)了,未來可能會(huì)變成十模大戰(zhàn),我對(duì)我們的大模型還是很有信心。
AI科技評(píng)論:您認(rèn)為在這波大模型和AIGC浪潮中,最受益的是誰?
方漢:第一波受益的肯定是賣鋤頭的企業(yè),比如做顯卡或者硬件的廠商,下游做光模塊、高速網(wǎng)卡的廠商都會(huì)從中受益。
AI科技評(píng)論:通用大模型、行業(yè)模型以及應(yīng)用層的難度一樣嗎?分別體現(xiàn)在哪些方面?
方漢:我覺得不一樣,通用大模型的難點(diǎn)在于訓(xùn)練成本和技術(shù)積累。行業(yè)模型的難點(diǎn)在于能否拿到某個(gè)垂直行業(yè)的專屬數(shù)據(jù)。比如法律文本,有一部分原來公開過,但并不是所有人能拿到所有的判定文本,這就是專有數(shù)據(jù)。
上層應(yīng)用考驗(yàn)的則是對(duì)行業(yè)以及產(chǎn)品形態(tài)的理解。現(xiàn)在業(yè)內(nèi)有一個(gè)普遍的現(xiàn)象,所有的產(chǎn)品經(jīng)理都是蒙的,不知道用AI做什么產(chǎn)品。而所有做技術(shù)的人都在講AI有多先進(jìn),你們可以發(fā)現(xiàn)做演講的都是技術(shù)人才,很少有產(chǎn)品經(jīng)理出來講我用AI做了一種新的商業(yè)模式,但實(shí)際上真正有威力的是誰能夠基于AI創(chuàng)造出新的顛覆式的商業(yè)模式。
每個(gè)層面的難點(diǎn)不一樣,最簡(jiǎn)單的反而是底層大模型,因?yàn)橹灰阌兴懔Γ蟹e累,就一定能做好。
AI科技評(píng)論:昆侖萬維最近收購了一個(gè)芯片廠商,是為了自己做訓(xùn)練用?還是有其他考量?
方漢:模型訓(xùn)練可能還早一點(diǎn)。但有一個(gè)問題,現(xiàn)在端側(cè)算力不夠,就是手機(jī)上不夠。vivo前段時(shí)間發(fā)布了一個(gè)模型,高通發(fā)布了一個(gè)能在手機(jī)上跑的芯片。所以我們認(rèn)為端側(cè)推理會(huì)成為一個(gè)大趨勢(shì)。尤其是手機(jī)。現(xiàn)在手機(jī)賣不動(dòng)了,為什么?因?yàn)閿z像頭和顯示屏已經(jīng)卷完了,4G、5G也卷完了,之后大家不知道卷什么了,下一波換機(jī)潮一定是AI換機(jī)潮,就是端側(cè)推理,因?yàn)槎藗?cè)推理是不需要付錢的,這些錢已經(jīng)包含在了你買手機(jī)的錢里,比如買手機(jī)能一口氣買斷了多少年的推斷成本。
AI科技評(píng)論:也就是說端側(cè)推理,會(huì)成為下一波大潮?
方漢:對(duì),下一個(gè)爆發(fā)點(diǎn)一定是端側(cè)推理。就像短視頻為什么能起來?是因?yàn)?G加攝像頭都卷到了一個(gè)臨界點(diǎn),短視頻起來和4G、攝像頭的卷有密不可分的關(guān)系。
AI卷到最后一定是端側(cè)推理出來后會(huì)出現(xiàn)各種驚艷的功能。而且最后所有手機(jī)廠商都會(huì)拼命營(yíng)銷,今天你的手機(jī)能跑30B,明天我的手機(jī)能跑50B,是不是跟卷攝像頭一模一樣?這是我們的一個(gè)認(rèn)知。其實(shí)這對(duì)行業(yè)是一種好事,會(huì)倒逼廠商訓(xùn)練7B、13B等小模型。
(雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))雷峰網(wǎng)雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。