昆侖萬維方漢：大模型時(shí)代，超級(jí) APP 不會(huì)是神話

本文作者：何思思

2023-12-06 17:45

導(dǎo)語：未來，超級(jí)APP不是一個(gè)，而是多個(gè)。

作者丨何思思

編輯丨陳彩嫻

“艱苦奮斗，獨(dú)立自主”——這是昆侖萬維董事長兼CEO方漢做大模型3年以來的真實(shí)感受。

早在今年4月，昆侖萬維就發(fā)布首款千億級(jí)參數(shù)大模型“天工”，是國內(nèi)最早一批擁有大模型的企業(yè)之一；今年8月，昆侖萬維更是推出了國內(nèi)首個(gè)融合了大模型能力的搜索引擎——天工AI搜索。

作為一家以游戲得名，后來發(fā)展成為國內(nèi)互聯(lián)網(wǎng)平臺(tái)的出海企業(yè)，昆侖萬維曾相繼并購孵化了包括Opera、StarMaker等在內(nèi)的多款現(xiàn)象級(jí)應(yīng)用。

然而從游戲互聯(lián)網(wǎng)公司到大模型，終究不是一步簡單的跨越?！皬挠螒虻匠龊Ｔ俎D(zhuǎn)做大模型，是一個(gè)如此大的跨界，底氣在哪兒？能做成嗎？還是在搶噱頭？”

方漢對(duì)AI科技評(píng)論表示，其實(shí)昆侖萬維對(duì)大模型的研究遠(yuǎn)比想象中要早得多，時(shí)間回到2020年，這一年ChatGPT還沒有火，但當(dāng)時(shí)昆侖萬維就押注了AIGC賽道。

談及為何先于ChatGPT出圈前，就入局大模型賽道？

方漢告訴AI科技評(píng)論：在外界看來跨度很大，但理由是很充分的。首先和公司的業(yè)務(wù)相關(guān)，昆侖萬維在海外主要主要做內(nèi)容平臺(tái)，包括音樂、社交、游戲、動(dòng)漫等，這意味著我們對(duì)任何一項(xiàng)技術(shù)變革都是非常敏銳的。另外還一個(gè)重要的原因是，較元宇宙、VR來說，AIGC和相關(guān)產(chǎn)品的結(jié)合，能更容易地覆蓋更多的普通人群。

2022年春節(jié)，昆侖萬維內(nèi)部提出“All in AIGC”的口號(hào)，同年年底發(fā)布了開源項(xiàng)目。

時(shí)間來到2023年，此時(shí)大模型在國內(nèi)蓬勃發(fā)展，昆侖萬維也加快了大模型以及相關(guān)產(chǎn)品的研究進(jìn)度。大模型層面，4月份發(fā)布了“天工”大模型，產(chǎn)品應(yīng)用層面，初步形成包括 AI大模型、AI搜索、AI游戲、AI社交、AI音樂、AI動(dòng)漫等六大方向在內(nèi)的 AI業(yè)務(wù)矩陣。

值得注意的是，從入局時(shí)間來看，昆侖萬維要早于國內(nèi)大部分企業(yè)，這也從側(cè)面說明了昆侖萬維在大模型這條新賽道上并非坦途。

“我們沿著GPT的路線辛辛苦苦做了3年，但這些苦難也鍛煉了我們獨(dú)立解決問題和處理問題的能力，我們把這段經(jīng)歷總結(jié)為‘艱苦奮斗，獨(dú)立自主’?！狈綕h笑著說道。

除了研發(fā)通用大模型，專有模型以及上層應(yīng)用外，方漢更是將開源的基因融入其中，基于天工大模型，昆侖萬維選擇開源了「天工」Skywork-13B系列大模型。

面對(duì)開源與閉源之爭，方漢表示，兩者并不矛盾，互為有機(jī)組成部分，開源的本質(zhì)是為了構(gòu)建良好的生態(tài)，讓更多中小企業(yè)能夠在大模型基礎(chǔ)上開展一些工作。

“昆侖萬維的體量相對(duì)較小，所以我們對(duì)大模型的研究會(huì)朝著離應(yīng)用更近的方向發(fā)展，”之于未來在大模型方面的規(guī)劃，方漢如是說。

以下為AI科技評(píng)論和方漢的對(duì)話：

跨界：不是為了股價(jià)，而是業(yè)務(wù)發(fā)展所需

AI科技評(píng)論：從游戲到出海，再到大模型，為什么要跨這么大的界？

方漢：在外界看來跨度很大，但其實(shí)理由是很充分的。

首先和公司業(yè)務(wù)有關(guān)。做游戲之前，我們是在海外做用戶增長的，而且在這方面有豐富的經(jīng)驗(yàn)。上市時(shí)我們就有了一個(gè)判斷，我們的增長能力大多在網(wǎng)游端，但當(dāng)時(shí)我們也在想是不是可以把這種能力賦能到別的互聯(lián)網(wǎng)品牌上，因?yàn)槲覀冎乐袊嗽诤Ｍ庾鲆粋€(gè)新的廠牌其實(shí)有難度的，所以我們就買了Grindr，把用戶量做大了五倍；然后買了StarMaker，用戶量從2000人做到了大概近千萬的日活。我們收購Opera后孵化出了三個(gè)產(chǎn)品，一是Opera News，目前是非洲最大的客戶端；二是OPay，非洲的支付平臺(tái)；三是Opera GX Browser，目前在歐美地區(qū)月活達(dá)到3000萬。所以我們在海外做平臺(tái)增長的經(jīng)驗(yàn)非常豐富。

另外，我們在海外做的是內(nèi)容平臺(tái)，包括音樂、社交、游戲、動(dòng)漫等，這就意味我們對(duì)任何一項(xiàng)技術(shù)變革都是非常關(guān)注的。還有一個(gè)原因，較元宇宙、VR來說，AIGC更容易覆蓋更多普通人群。為什么呢？當(dāng)時(shí)雖然ChatGPT還沒出來，但是抖音上的換臉玩法已經(jīng)出來了，其實(shí)背后都是AI技術(shù)的支撐，只是沒有現(xiàn)在這么明顯而已。

當(dāng)時(shí)我們還做了一個(gè)測試：一塊手表的重量是70克，手機(jī)是300克到400克，但當(dāng)時(shí)的VR設(shè)備大概在一斤半左右，所以以我們當(dāng)時(shí)的看法，認(rèn)為VR賽道很難做起來，因?yàn)閷?shí)在太重了。元宇宙則是另外一個(gè)邏輯，我們認(rèn)為元宇宙在人和人溝通的效率方面實(shí)際上比不上線下見面，所以我們認(rèn)為元宇宙也不會(huì)有很大的市場。

但AI就不一樣了，目前90%的美國大學(xué)生都在使用ChatGPT做作業(yè)，國內(nèi)很多電商基本上都在用AIGC生成商品圖片。這一波AI對(duì)普通人的滲透遠(yuǎn)比我們想象得要大的多。所以我們認(rèn)為AIGC和之前的互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)兩波浪潮一樣，會(huì)是一個(gè)大的技術(shù)變革，我們就決定投入了。

AI科技評(píng)論：什么時(shí)候決定全方位投入的？

方漢：2020年GPT3出來時(shí)，我們就很快地意識(shí)到了AIGC會(huì)是一個(gè)非常大的里程碑。2021年開始鋪算力，并訓(xùn)練出了一個(gè)140億參數(shù)的大模型，同時(shí)組建了一個(gè)專門做音樂生成的團(tuán)隊(duì)；2022年春節(jié)，內(nèi)部開了戰(zhàn)略會(huì)，提出了All in AIGC的口號(hào)；2022年年底12月份，疫情剛放開時(shí)，我們就發(fā)布了開源項(xiàng)目，其實(shí)當(dāng)時(shí)ChatGPT還沒有火，對(duì)于像我們這樣一個(gè)中等體量的互聯(lián)網(wǎng)公司來說，我們做的事情要比業(yè)界同行稍微早一些。

AI科技評(píng)論：最初瞄準(zhǔn)的就是AGI嗎？

方漢：首先，我們跟進(jìn)大模型這件事，完全不是為了股價(jià)。因?yàn)锳GI和AIGC是兩碼事，所以當(dāng)時(shí)只想到了AIGC對(duì)我們公司業(yè)務(wù)的發(fā)展非常重要。包括我們現(xiàn)在設(shè)立的音樂、漫畫、社交、游戲等方向，都是我們的傳統(tǒng)產(chǎn)品，只有AI搜索算是和大模型結(jié)合后的一個(gè)新發(fā)現(xiàn)。

當(dāng)然，天工大模型是通用大模型，但是想要在每個(gè)行業(yè)落地，還要在對(duì)應(yīng)的專有模型上做應(yīng)用，所以在天工大模型這個(gè)底座之上，還訓(xùn)練出了3D生成模型，圖像生成模型、視頻生成模型，音樂生成模型等專有模型。

入局大模型：沒有參考，只能獨(dú)立自主

AI科技評(píng)論：最初選擇的是Bert路線還是GPT路線？早期國內(nèi)大部分企業(yè)可能都是基于Bert做研究的。

方漢：我們最初選擇的就是GPT路線，當(dāng)時(shí)沒有任何開源框架可以參考，所以我們是沿著GPT的路線辛辛苦苦做了3年。在國內(nèi)廠商里是相對(duì)非常早期的。（更多關(guān)于大模型行業(yè)的故事，歡迎添加微信 ericahss1224，互相交流，互通有無）

AI科技評(píng)論：這個(gè)過程中有什么困難點(diǎn)嗎？畢竟起步確實(shí)太早了。

方漢：2020年剛開始做的時(shí)候，確實(shí)挺辛苦的。因?yàn)闆]有任何可以參考的內(nèi)容，而且當(dāng)時(shí)國內(nèi)大部分企業(yè)走的是Bert路線，GPT路線的人不好找，所以只能根據(jù)一些公開文獻(xiàn)從頭研究。

但這樣也鍛煉了我們獨(dú)立解決問題和處理問題的能力，我們把這段經(jīng)歷總結(jié)為“艱苦奮斗，獨(dú)立自主?！币詳?shù)據(jù)處理團(tuán)隊(duì)為例，從2020年搭建到現(xiàn)在，應(yīng)該是國內(nèi)最老牌、最成熟的團(tuán)隊(duì)了。

AI科技評(píng)論：現(xiàn)在很多企業(yè)都在強(qiáng)調(diào)數(shù)據(jù)的量和質(zhì)量，對(duì)于昆侖來說，數(shù)據(jù)是最難攻克的一關(guān)嗎？

方漢：數(shù)據(jù)處理肯定是一個(gè)難點(diǎn)。對(duì)于大模型訓(xùn)練來說，數(shù)據(jù)質(zhì)量的重要性往往高于數(shù)據(jù)的量，因?yàn)閿?shù)據(jù)很容易收集，但高質(zhì)量的數(shù)據(jù)很難。

比如，中國擁有全世界最大的中小學(xué)生題庫，但這個(gè)題庫你直接問題大模型質(zhì)量是很差的，因?yàn)轭}庫中的數(shù)據(jù)沒有經(jīng)過標(biāo)準(zhǔn)化和格式化的處理。所有公式可能都是圖片文件，這就要把這些公式全部轉(zhuǎn)成文本可描述的文件。這就要花很長時(shí)間才能完成。像中國可能有兩億道中小學(xué)生題庫，處理完了之后質(zhì)量高的可能不到一千萬道，這是一個(gè)很辛苦的數(shù)據(jù)處理過程。當(dāng)然這個(gè)過程也會(huì)涉及到數(shù)據(jù)清洗、加工、重新整理。最麻煩的是針對(duì)質(zhì)量不好的數(shù)據(jù)，要想辦法寫工具，把質(zhì)量變好，甚至要雇一批數(shù)據(jù)標(biāo)注人才把數(shù)據(jù)標(biāo)好，這是相當(dāng)麻煩且繁瑣的工作。

另外，在數(shù)據(jù)層面，最重要的不是數(shù)據(jù)加工的能力而是數(shù)據(jù)生產(chǎn)的能力，目前很多數(shù)據(jù)是空白的，尤其是在一些很窄的領(lǐng)域，所以必須生產(chǎn)出來。以音樂數(shù)據(jù)為例，全世界每年能夠生產(chǎn)3億首，其中中國每年就能生產(chǎn)200萬首歌，但實(shí)際上可能只有20萬首是標(biāo)注好的，那怎么辦？只能自己花錢加工數(shù)據(jù)。所以現(xiàn)在質(zhì)量高的數(shù)據(jù)是非常稀缺的。

AI科技評(píng)論：其實(shí)數(shù)據(jù)層面，也會(huì)涉及到數(shù)據(jù)合規(guī)的問題？

方漢：首先要有一個(gè)正確的心態(tài)，我們一直認(rèn)為數(shù)據(jù)合規(guī)和法律監(jiān)管是行業(yè)健康發(fā)展的前提，所以我們一開始就會(huì)配合各部門完成數(shù)據(jù)保護(hù)等工作，這是最關(guān)鍵的。我們認(rèn)為有監(jiān)管比沒監(jiān)管好，如果沒有監(jiān)管的話，各種不健康不合規(guī)的東西出來了，行業(yè)的發(fā)展會(huì)受限制，企業(yè)的損失也會(huì)很慘重。

在出海過程中，中國一些企業(yè)就是因?yàn)椴恢匾暫弦?guī)，出現(xiàn)了各種各樣的問題。對(duì)于大模型訓(xùn)練來說也是一樣的，最關(guān)鍵的是敏感數(shù)據(jù)不能出境。

我們在東南亞、歐洲等地區(qū)發(fā)展好的原因就在于我們堅(jiān)決服從監(jiān)管，而且最大限度地配合監(jiān)管部門做事。國內(nèi)也一樣，我們是全國第二家提交大模型審核的企業(yè)，北京市第二批通過的。

其實(shí)AI這波數(shù)據(jù)保護(hù)法規(guī)，各國還在規(guī)劃中。我們也在緊密關(guān)注，會(huì)全力配合。中國是大模型落地比較早的國家，所以我們配合得非常好。其他國家可能還沒有完全落地，但我們在持續(xù)關(guān)注。

AI科技評(píng)論：美國的持續(xù)封鎖，會(huì)不會(huì)有算力方面的擔(dān)憂？

方漢：肯定會(huì)有影響?，F(xiàn)在業(yè)界出現(xiàn)了兩個(gè)新的摩爾定律，一是，出自O(shè)penAI——每18個(gè)月人類的知識(shí)會(huì)翻倍，我對(duì)此表示質(zhì)疑；

二是，大模型的訓(xùn)練和推理成本會(huì)以每年10倍的速度遞減，也就是說每年的訓(xùn)練成本和推理成本會(huì)下降10倍左右，我表示贊同。為什么？因?yàn)楝F(xiàn)在所有人都在拼命優(yōu)化，也出現(xiàn)了很多新的理論，比如最早的文生圖基本15分鐘才能完成，現(xiàn)在4、5秒就能完成了，直接降了60倍。

另外，手機(jī)上現(xiàn)在已經(jīng)能跑7B、13B的模型了，5年之后手機(jī)上一定能跑80B的模型，所以最后離線推斷一定會(huì)成為主流。

AI科技評(píng)論：現(xiàn)在國內(nèi)很多企業(yè)還是有算力方面的擔(dān)憂的，國內(nèi)有可替代的嗎？

方漢：華為910B幾乎能達(dá)到A100 85%的性能，主要問題在于他的底層軟件的穩(wěn)定性和硬件的兼容性還在不斷修補(bǔ)中，但是用作推理已經(jīng)沒有任何問題了，訓(xùn)練還差一點(diǎn)，還需要大家陪著它再改一段時(shí)間。

國內(nèi)能夠達(dá)到910B水平的一共只有兩三家，但是國產(chǎn)芯片最大的問題是產(chǎn)能，只要產(chǎn)能上去了，肯定能替代。國內(nèi)芯片在設(shè)計(jì)上一點(diǎn)也不落后，和A100的差距已經(jīng)不大了，H100和H200還需要時(shí)間追趕。（更多關(guān)于大模型行業(yè)的故事，歡迎添加微信 ericahss1224，互相交流，互通有無）

面對(duì)競爭：差異化是前提，其次是認(rèn)知

AI科技評(píng)論：相對(duì)于其他五款產(chǎn)品來說，AI搜索是新產(chǎn)品，為什么選擇搜索這個(gè)方向？

方漢：很簡單的邏輯。AI搜索不是憑空產(chǎn)生的，是舊的技術(shù)和大模型技術(shù)結(jié)合后推出的新產(chǎn)品。

其實(shí)我們做搜索已經(jīng)有6年的時(shí)間了。在這方面的技術(shù)儲(chǔ)備遠(yuǎn)比想象的多，早期我們做Opera News，它的背后其實(shí)是有一個(gè)搜索引擎支撐的，這個(gè)搜索引擎每天可能要收集幾千萬個(gè)英文的站點(diǎn)，把新聞抓取下來然后轉(zhuǎn)成用戶可以訪問的，就像今日頭條一樣。所以AI搜索反而是最早ready的。

AI科技評(píng)論：除了AI搜索，還有游戲、社交、音樂等產(chǎn)品，這些產(chǎn)品的推出節(jié)奏是什么樣的？

方漢：基本會(huì)跟用戶的節(jié)奏走，我們會(huì)在用戶端不斷地測試，一旦我們認(rèn)為測試效果、數(shù)據(jù)和用戶的反饋達(dá)標(biāo)了，就會(huì)推出來。目前除了AI搜索外，AI音樂、AI動(dòng)漫、AI社交和AI游戲等產(chǎn)品都在海外市場測試中。

AI科技評(píng)論：可以理解為AI搜索主要面向國內(nèi)，其他產(chǎn)品面向海外？

方漢：其他五款產(chǎn)品在海外落地成功后，會(huì)考慮在國內(nèi)進(jìn)行推廣。

首先全世界付費(fèi)習(xí)慣最好的市場是歐美，其次是中國。我們首選歐美市場，因?yàn)闅W美用戶的付費(fèi)習(xí)慣比較好，目前OpenAI付費(fèi)最多的用戶也集中在歐美市場。所以會(huì)選擇先做價(jià)值較大的市場。

AI科技評(píng)論：其實(shí)現(xiàn)在各大廠都在做產(chǎn)品的重構(gòu)，昆侖在這方面有什么不同？

方漢：大家的思路不同，我們一直在做面向C端的端到端的內(nèi)容生產(chǎn)方。

其實(shí)從去年我們就一直在思考大模型之后是什么，當(dāng)時(shí)我們就預(yù)判了肯定是千模大戰(zhàn)，但是在這場戰(zhàn)役中，我們不一定能勝出。所以我們就想清楚了，不做效率工具，只做平臺(tái)。這個(gè)事情其實(shí)比大家想的要早一點(diǎn)。

AI科技評(píng)論：關(guān)于C端，大家都在討論超級(jí)應(yīng)用，您認(rèn)為距離下一個(gè)超級(jí)應(yīng)用，還有多長時(shí)間？

方漢：肯定有超級(jí)應(yīng)用，但不止一個(gè)超級(jí)應(yīng)用，互聯(lián)網(wǎng)時(shí)代誕生了谷歌、亞馬遜、Meta（Facebook），移動(dòng)互聯(lián)網(wǎng)催生了Snapchat、Twitter，包括國內(nèi)的字節(jié)、美團(tuán)、滴滴等都是超級(jí)APP，但沒有一個(gè)超級(jí)app能把所有超級(jí)APP集合起來。所以我認(rèn)為一個(gè)超級(jí)APP包打天下是不太可能的，未來可能會(huì)出現(xiàn)幾個(gè)超級(jí)APP。

聚焦到具體的領(lǐng)域，游戲和電影一樣不太可能出現(xiàn)超級(jí)APP，社交、音樂、動(dòng)漫等都有可能。

AI科技評(píng)論：關(guān)于C端，大家都在討論超級(jí)應(yīng)用，您有信心嗎？

方漢：信心肯定得有，我也相信我們一定能做出超級(jí)APP。因?yàn)槲覀冏龅谋容^早，希望也比較大，但誰也不敢保證100%一定能做成，畢竟機(jī)緣巧合的事情太多了。只能說我們會(huì)盡力朝著超級(jí)APP的方向努力，所以我們一直做平臺(tái)，不做工具。因?yàn)樽龉ぞ呤亲霾怀沙?jí)APP的。

大模型形態(tài)之爭：開源是大趨勢

AI科技評(píng)論：除天工外，昆侖還開源了13B模型，好像很多廠商都喜歡把6B、7B或者13B作為一個(gè)節(jié)點(diǎn)？

方漢：其實(shí)邏輯很簡單，和顯存相關(guān)。4090消費(fèi)級(jí)顯卡的內(nèi)存是24G，6B需要12G，13B需要26G左右。所以6B和13B都是消費(fèi)級(jí)顯卡，大家可以直接拿回去玩，或者供小企業(yè)使用，因?yàn)橄M(fèi)級(jí)顯卡特別便宜。為什么A100、H100性能高，因?yàn)橐粋€(gè)是40G內(nèi)存，一個(gè)是120G，單卡多少G的內(nèi)存是非常關(guān)鍵的。

這就是為什么蘋果新一代筆記本特別強(qiáng)的原因，因?yàn)樗芘艿?96G。所以最新版本的蘋果電腦理論上可以跑一個(gè)300B的模型，只是慢一點(diǎn)而已。

AI科技評(píng)論：那為什么參數(shù)大的模型會(huì)選擇閉源？是商業(yè)化方面的考慮？

方漢：因?yàn)榇蟛糠秩硕寂懿黄饋恚阏f是為了商業(yè)化考慮嗎？任何一家大模型企業(yè)都要考慮商業(yè)化，這是一件非常正常的事情。實(shí)際上最重要的還是底座大模型，一個(gè)千億級(jí)別的大模型對(duì)我們而言，最關(guān)鍵的是技術(shù)機(jī)密。在這之上訓(xùn)練出很多小模型開源給大家使用，完全是沒問題的。

AI科技評(píng)論：昆侖為什么要選擇開源？怎么看待開源和閉源的關(guān)系？

方漢：我認(rèn)為開源的話，做生態(tài)比較容易，對(duì)中小企業(yè)的機(jī)會(huì)也會(huì)更大。

開源和閉源并不矛盾，二者互為有機(jī)組成部分。這和做開源公司的leader的商業(yè)模式有關(guān)。

就像Meta（Facebook）屬于后來的攪局者，對(duì)他來說，他不依靠大模型，對(duì)他的業(yè)務(wù)也沒有致命性的影響，所以他就直接開源了，所以現(xiàn)在開源模型最好的是Meta的LLaMA 2。

目前國內(nèi)大模型還處在誰先發(fā)完全開源的大模型，大家一擁而上的狀態(tài)。我們?nèi)ツ?2月份發(fā)布大模型之后，利用我們的大模型做研發(fā)的企業(yè)特別多。我覺得這是很正常的事。

但我認(rèn)為開源的本質(zhì)是為了構(gòu)建一個(gè)良好的生態(tài)，讓更多的中小企業(yè)能夠在我們的大模型上開展一些工作。

AI科技評(píng)論：現(xiàn)在老生常談的一個(gè)話題是，開源怎么掙錢？

方漢：做開源的話，一開始大家確實(shí)不知道怎么掙錢。其實(shí)開源怎么變現(xiàn)已經(jīng)有一套很成熟的邏輯了。最近MongoDB提出了一個(gè)新的邏輯SSPL，他說我開源出來，你可以隨便用，不用給我交錢。但是云廠商不能用這個(gè)給別人提供服務(wù)。包括百度、阿里、亞馬遜等云廠商，如果要給別人提供服務(wù)的話，必須付費(fèi)。

但是因?yàn)樵朴?jì)算是一個(gè)大的趨勢，大家都希望云廠商來提供服務(wù)。MongoDB的說法是云廠商不許用，只能我來提供云服務(wù)，相當(dāng)于把云服務(wù)的版權(quán)卡死了。只有他們能夠提供這項(xiàng)服務(wù)，這樣就會(huì)很掙錢，像MongoDB每年都有幾十億的營收。（更多關(guān)于大模型行業(yè)的故事，歡迎添加微信 ericahss1224，互相交流，互通有無）

AI科技評(píng)論：內(nèi)部產(chǎn)品是在天工閉源大模型上做的，還是在開源模型上做的？

方漢：是在天工底座大模型之上，裁剪出的各種專有小模型上研發(fā)的。

大模型落地：早期蓬勃發(fā)展，且雜亂

AI科技評(píng)論：您認(rèn)為大模型想要落地難嗎？

方漢：大模型在B端的落地速度會(huì)非?？臁Ｒ?yàn)橛行〣端企業(yè)，尤其是國企、世界500強(qiáng)企業(yè)的付費(fèi)習(xí)慣極好。很多人說大模型能不能在B端掙錢，就看微軟的股價(jià)什么時(shí)候漲。因?yàn)楝F(xiàn)在全世界做B端生意的，微軟是走的最好的。

國內(nèi)的話，要看怎么激發(fā)用戶的痛點(diǎn)，比如我們做商品圖片生成，目前很多小企業(yè)、淘寶商家的付費(fèi)意愿都很強(qiáng)，因?yàn)樗麄冋姨詫毮Ｌ嘏囊粡埳唐穲D片的成本可能是200塊錢到500塊錢，AIGC 2塊錢到5塊錢就能解決，所以淘寶模特和攝影師未來肯定會(huì)失業(yè)。

AI科技評(píng)論：所以不存在大模型商業(yè)化落地難的問題了？

方漢：當(dāng)然存在，因?yàn)楝F(xiàn)在大模型的能力遠(yuǎn)遠(yuǎn)不夠，他能幫用戶解決的問題也是有限的。

為什么淘寶的商品圖片生成會(huì)率先被打破，比如一個(gè)身穿大衣的模特，多了根手頭，少了根手指頭，用戶是能容忍的，只要簡單地修一下就可以了。但如果是法律問題，你告訴我這個(gè)人應(yīng)該從判3年改到判10年，這就是一個(gè)大問題了。所以想要在金融、法律、醫(yī)療等比較嚴(yán)肅的行業(yè)落地還是有難度的。內(nèi)容賽道就比較容易了，比如漫畫畫錯(cuò)了就畫錯(cuò)了，大家在這方面的容忍度還是很高的。

現(xiàn)在大模型商業(yè)化還處在早期蓬勃發(fā)展且比較混亂的階段，但這是任何一項(xiàng)新技術(shù)發(fā)展的必經(jīng)之路，如果一開始不雜亂的話，怎么能優(yōu)勝劣汰出現(xiàn)一批真正優(yōu)秀的公司呢。所以說這是一個(gè)很正常的現(xiàn)象。

AI科技評(píng)論：您認(rèn)為哪些行業(yè)比較容易落地，哪些困難？

方漢：容錯(cuò)率低的行業(yè)最難進(jìn)，容錯(cuò)率高的行業(yè)很容易進(jìn)。

AI科技評(píng)論：三年以來，對(duì)大模型有沒有一個(gè)改觀？

方漢：大模型的智能能力越來越強(qiáng)，這是我們一開始想不到的，但我認(rèn)為還有很多所謂的局限性。比如智能程度沒有那么高，最難的像3D模型的生產(chǎn)、以及視頻生成技術(shù)還沒有完全解決。

我們堅(jiān)信未來一定會(huì)解決，但對(duì)于中小企業(yè)來說，不能等這些問題都解決了再研發(fā)產(chǎn)品，而是要提前做好準(zhǔn)備。

AI科技評(píng)論：怎么平衡天工大模型和上層AI產(chǎn)品的關(guān)系，未來會(huì)有所側(cè)重嗎？

方漢：首先一個(gè)是基礎(chǔ)架構(gòu)，一個(gè)是上層應(yīng)用，沒有所謂的偏重。

目前大部分應(yīng)用廠商沒有自己的大模型，只能調(diào)用別人的API，這就會(huì)出現(xiàn)很多風(fēng)險(xiǎn)。比如出現(xiàn)問題時(shí)只能先向上反應(yīng)，等別人來改。再比如LLaMA是一個(gè)英文模型，它的中文語料不夠，所以想要做中文的很難。

好處在于，從大往小做容易。我們能基于底座大模型定制各類行業(yè)模型，加上對(duì)大模型有著深刻的認(rèn)知和理解，也能加快做行業(yè)模型的進(jìn)度，無論這個(gè)模型的質(zhì)量是不是行業(yè)內(nèi)最好的。

AI科技評(píng)論：未來競爭會(huì)愈演愈烈，怎么保持競爭優(yōu)勢？

方漢：我們公司相對(duì)比較小，部門間的溝通會(huì)比較多。所以我們對(duì)于大模型的研究會(huì)朝著離應(yīng)用更近的方向運(yùn)行。

大模型的未來：端側(cè)推理將成為下一個(gè)爆發(fā)點(diǎn)

AI科技評(píng)論：目前國內(nèi)大模型的發(fā)展歸于平淡了，您怎么看？

方漢：很大程度上是因?yàn)樗懔Τ跃o。訓(xùn)練GPT-3.5只需1000張卡，GPT-4需要5000張卡起步。GPT-5估計(jì)要3萬張卡左右。算力不夠很難訓(xùn)出下一代模型。這是很實(shí)際的問題。

所以以前是千模大戰(zhàn)，現(xiàn)在已經(jīng)變成百模大戰(zhàn)了，未來可能會(huì)變成十模大戰(zhàn)，我對(duì)我們的大模型還是很有信心。

AI科技評(píng)論：您認(rèn)為在這波大模型和AIGC浪潮中，最受益的是誰？

方漢：第一波受益的肯定是賣鋤頭的企業(yè)，比如做顯卡或者硬件的廠商，下游做光模塊、高速網(wǎng)卡的廠商都會(huì)從中受益。

AI科技評(píng)論：通用大模型、行業(yè)模型以及應(yīng)用層的難度一樣嗎？分別體現(xiàn)在哪些方面？

方漢：我覺得不一樣，通用大模型的難點(diǎn)在于訓(xùn)練成本和技術(shù)積累。行業(yè)模型的難點(diǎn)在于能否拿到某個(gè)垂直行業(yè)的專屬數(shù)據(jù)。比如法律文本，有一部分原來公開過，但并不是所有人能拿到所有的判定文本，這就是專有數(shù)據(jù)。

上層應(yīng)用考驗(yàn)的則是對(duì)行業(yè)以及產(chǎn)品形態(tài)的理解。現(xiàn)在業(yè)內(nèi)有一個(gè)普遍的現(xiàn)象，所有的產(chǎn)品經(jīng)理都是蒙的，不知道用AI做什么產(chǎn)品。而所有做技術(shù)的人都在講AI有多先進(jìn)，你們可以發(fā)現(xiàn)做演講的都是技術(shù)人才，很少有產(chǎn)品經(jīng)理出來講我用AI做了一種新的商業(yè)模式，但實(shí)際上真正有威力的是誰能夠基于AI創(chuàng)造出新的顛覆式的商業(yè)模式。

每個(gè)層面的難點(diǎn)不一樣，最簡單的反而是底層大模型，因?yàn)橹灰阌兴懔Γ蟹e累，就一定能做好。

AI科技評(píng)論：昆侖萬維最近收購了一個(gè)芯片廠商，是為了自己做訓(xùn)練用？還是有其他考量？

方漢：模型訓(xùn)練可能還早一點(diǎn)。但有一個(gè)問題，現(xiàn)在端側(cè)算力不夠，就是手機(jī)上不夠。vivo前段時(shí)間發(fā)布了一個(gè)模型，高通發(fā)布了一個(gè)能在手機(jī)上跑的芯片。所以我們認(rèn)為端側(cè)推理會(huì)成為一個(gè)大趨勢。尤其是手機(jī)?，F(xiàn)在手機(jī)賣不動(dòng)了，為什么？因?yàn)閿z像頭和顯示屏已經(jīng)卷完了，4G、5G也卷完了，之后大家不知道卷什么了，下一波換機(jī)潮一定是AI換機(jī)潮，就是端側(cè)推理，因?yàn)槎藗?cè)推理是不需要付錢的，這些錢已經(jīng)包含在了你買手機(jī)的錢里，比如買手機(jī)能一口氣買斷了多少年的推斷成本。

AI科技評(píng)論：也就是說端側(cè)推理，會(huì)成為下一波大潮？

方漢：對(duì)，下一個(gè)爆發(fā)點(diǎn)一定是端側(cè)推理。就像短視頻為什么能起來？是因?yàn)?G加攝像頭都卷到了一個(gè)臨界點(diǎn)，短視頻起來和4G、攝像頭的卷有密不可分的關(guān)系。

AI卷到最后一定是端側(cè)推理出來后會(huì)出現(xiàn)各種驚艷的功能。而且最后所有手機(jī)廠商都會(huì)拼命營銷，今天你的手機(jī)能跑30B，明天我的手機(jī)能跑50B，是不是跟卷攝像頭一模一樣？這是我們的一個(gè)認(rèn)知。其實(shí)這對(duì)行業(yè)是一種好事，會(huì)倒逼廠商訓(xùn)練7B、13B等小模型。

（雷峰網(wǎng)雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))雷峰網(wǎng)）

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

何思思

工業(yè)口編輯

關(guān)注新基建，聚焦工業(yè)互聯(lián)網(wǎng)領(lǐng)域網(wǎng)絡(luò)安全丨微信：15230152798

掃描關(guān)注作者微信

發(fā)私信

當(dāng)月熱門文章