丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給何思思
發(fā)送

0

昆侖萬維方漢:大模型時代,超級 APP 不會是神話

本文作者: 何思思 2023-12-06 17:45
導(dǎo)語:未來,超級APP不是一個,而是多個。

昆侖萬維方漢:大模型時代,超級 APP 不會是神話

作者丨何思思

編輯丨陳彩嫻

“艱苦奮斗,獨立自主”——這是昆侖萬維董事長兼CEO方漢做大模型3年以來的真實感受。

早在今年4月,昆侖萬維就發(fā)布首款千億級參數(shù)大模型“天工”,是國內(nèi)最早一批擁有大模型的企業(yè)之一;今年8月,昆侖萬維更是推出了國內(nèi)首個融合了大模型能力的搜索引擎——天工AI搜索。

作為一家以游戲得名,后來發(fā)展成為國內(nèi)互聯(lián)網(wǎng)平臺的出海企業(yè),昆侖萬維曾相繼并購孵化了包括Opera、StarMaker等在內(nèi)的多款現(xiàn)象級應(yīng)用。

然而從游戲互聯(lián)網(wǎng)公司到大模型,終究不是一步簡單的跨越?!皬挠螒虻匠龊T俎D(zhuǎn)做大模型,是一個如此大的跨界,底氣在哪兒?能做成嗎?還是在搶噱頭?”

方漢對AI科技評論表示,其實昆侖萬維對大模型的研究遠(yuǎn)比想象中要早得多,時間回到2020年,這一年ChatGPT還沒有火,但當(dāng)時昆侖萬維就押注了AIGC賽道。

談及為何先于ChatGPT出圈前,就入局大模型賽道?

方漢告訴AI科技評論:在外界看來跨度很大,但理由是很充分的。首先和公司的業(yè)務(wù)相關(guān),昆侖萬維在海外主要主要做內(nèi)容平臺,包括音樂、社交、游戲、動漫等,這意味著我們對任何一項技術(shù)變革都是非常敏銳的。另外還一個重要的原因是,較元宇宙、VR來說,AIGC和相關(guān)產(chǎn)品的結(jié)合,能更容易地覆蓋更多的普通人群。

2022年春節(jié),昆侖萬維內(nèi)部提出“All in AIGC”的口號,同年年底發(fā)布了開源項目。

時間來到2023年,此時大模型在國內(nèi)蓬勃發(fā)展,昆侖萬維也加快了大模型以及相關(guān)產(chǎn)品的研究進(jìn)度。大模型層面,4月份發(fā)布了“天工”大模型,產(chǎn)品應(yīng)用層面,初步形成包括 AI大模型、AI搜索、AI游戲、AI社交、AI音樂、AI動漫等六大方向在內(nèi)的 AI業(yè)務(wù)矩陣。

值得注意的是,從入局時間來看,昆侖萬維要早于國內(nèi)大部分企業(yè),這也從側(cè)面說明了昆侖萬維在大模型這條新賽道上并非坦途。

“我們沿著GPT的路線辛辛苦苦做了3年,但這些苦難也鍛煉了我們獨立解決問題和處理問題的能力,我們把這段經(jīng)歷總結(jié)為‘艱苦奮斗,獨立自主’。”方漢笑著說道。

除了研發(fā)通用大模型,專有模型以及上層應(yīng)用外,方漢更是將開源的基因融入其中,基于天工大模型,昆侖萬維選擇開源了「天工」Skywork-13B系列大模型。

面對開源與閉源之爭,方漢表示,兩者并不矛盾,互為有機組成部分,開源的本質(zhì)是為了構(gòu)建良好的生態(tài),讓更多中小企業(yè)能夠在大模型基礎(chǔ)上開展一些工作。

“昆侖萬維的體量相對較小,所以我們對大模型的研究會朝著離應(yīng)用更近的方向發(fā)展,”之于未來在大模型方面的規(guī)劃,方漢如是說。

以下為AI科技評論和方漢的對話:

跨界:不是為了股價,而是業(yè)務(wù)發(fā)展所需

AI科技評論:從游戲到出海,再到大模型,為什么要跨這么大的界?

方漢:在外界看來跨度很大,但其實理由是很充分的。

首先和公司業(yè)務(wù)有關(guān)。做游戲之前,我們是在海外做用戶增長的,而且在這方面有豐富的經(jīng)驗。上市時我們就有了一個判斷,我們的增長能力大多在網(wǎng)游端,但當(dāng)時我們也在想是不是可以把這種能力賦能到別的互聯(lián)網(wǎng)品牌上,因為我們知道中國人在海外做一個新的廠牌其實有難度的,所以我們就買了Grindr,把用戶量做大了五倍;然后買了StarMaker,用戶量從2000人做到了大概近千萬的日活。我們收購Opera后孵化出了三個產(chǎn)品,一是Opera News,目前是非洲最大的客戶端;二是OPay,非洲的支付平臺;三是Opera GX Browser,目前在歐美地區(qū)月活達(dá)到3000萬。所以我們在海外做平臺增長的經(jīng)驗非常豐富。

另外,我們在海外做的是內(nèi)容平臺,包括音樂、社交、游戲、動漫等,這就意味我們對任何一項技術(shù)變革都是非常關(guān)注的。還有一個原因,較元宇宙、VR來說,AIGC更容易覆蓋更多普通人群。為什么呢?當(dāng)時雖然ChatGPT還沒出來,但是抖音上的換臉玩法已經(jīng)出來了,其實背后都是AI技術(shù)的支撐,只是沒有現(xiàn)在這么明顯而已。

當(dāng)時我們還做了一個測試:一塊手表的重量是70克,手機是300克到400克,但當(dāng)時的VR設(shè)備大概在一斤半左右,所以以我們當(dāng)時的看法,認(rèn)為VR賽道很難做起來,因為實在太重了。元宇宙則是另外一個邏輯,我們認(rèn)為元宇宙在人和人溝通的效率方面實際上比不上線下見面,所以我們認(rèn)為元宇宙也不會有很大的市場。

但AI就不一樣了,目前90%的美國大學(xué)生都在使用ChatGPT做作業(yè),國內(nèi)很多電商基本上都在用AIGC生成商品圖片。這一波AI對普通人的滲透遠(yuǎn)比我們想象得要大的多。所以我們認(rèn)為AIGC和之前的互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)兩波浪潮一樣,會是一個大的技術(shù)變革,我們就決定投入了。

AI科技評論:什么時候決定全方位投入的?

方漢:2020年GPT3出來時,我們就很快地意識到了AIGC會是一個非常大的里程碑。2021年開始鋪算力,并訓(xùn)練出了一個140億參數(shù)的大模型,同時組建了一個專門做音樂生成的團(tuán)隊;2022年春節(jié),內(nèi)部開了戰(zhàn)略會,提出了All in AIGC的口號;2022年年底12月份,疫情剛放開時,我們就發(fā)布了開源項目,其實當(dāng)時ChatGPT還沒有火,對于像我們這樣一個中等體量的互聯(lián)網(wǎng)公司來說,我們做的事情要比業(yè)界同行稍微早一些。

AI科技評論:最初瞄準(zhǔn)的就是AGI嗎?

方漢:首先,我們跟進(jìn)大模型這件事,完全不是為了股價。因為AGI和AIGC是兩碼事,所以當(dāng)時只想到了AIGC對我們公司業(yè)務(wù)的發(fā)展非常重要。包括我們現(xiàn)在設(shè)立的音樂、漫畫、社交、游戲等方向,都是我們的傳統(tǒng)產(chǎn)品,只有AI搜索算是和大模型結(jié)合后的一個新發(fā)現(xiàn)。

當(dāng)然,天工大模型是通用大模型,但是想要在每個行業(yè)落地,還要在對應(yīng)的專有模型上做應(yīng)用,所以在天工大模型這個底座之上,還訓(xùn)練出了3D生成模型,圖像生成模型、視頻生成模型,音樂生成模型等專有模型。

入局大模型:沒有參考,只能獨立自主

AI科技評論:最初選擇的是Bert路線還是GPT路線?早期國內(nèi)大部分企業(yè)可能都是基于Bert做研究的。

方漢:我們最初選擇的就是GPT路線,當(dāng)時沒有任何開源框架可以參考,所以我們是沿著GPT的路線辛辛苦苦做了3年。在國內(nèi)廠商里是相對非常早期的。(更多關(guān)于大模型行業(yè)的故事,歡迎添加微信 ericahss1224,互相交流,互通有無)

AI科技評論:這個過程中有什么困難點嗎?畢竟起步確實太早了。

方漢:2020年剛開始做的時候,確實挺辛苦的。因為沒有任何可以參考的內(nèi)容,而且當(dāng)時國內(nèi)大部分企業(yè)走的是Bert路線,GPT路線的人不好找,所以只能根據(jù)一些公開文獻(xiàn)從頭研究。

但這樣也鍛煉了我們獨立解決問題和處理問題的能力,我們把這段經(jīng)歷總結(jié)為“艱苦奮斗,獨立自主?!币詳?shù)據(jù)處理團(tuán)隊為例,從2020年搭建到現(xiàn)在,應(yīng)該是國內(nèi)最老牌、最成熟的團(tuán)隊了。

AI科技評論:現(xiàn)在很多企業(yè)都在強調(diào)數(shù)據(jù)的量和質(zhì)量,對于昆侖來說,數(shù)據(jù)是最難攻克的一關(guān)嗎?

方漢:數(shù)據(jù)處理肯定是一個難點。對于大模型訓(xùn)練來說,數(shù)據(jù)質(zhì)量的重要性往往高于數(shù)據(jù)的量,因為數(shù)據(jù)很容易收集,但高質(zhì)量的數(shù)據(jù)很難。

比如,中國擁有全世界最大的中小學(xué)生題庫,但這個題庫你直接問題大模型質(zhì)量是很差的,因為題庫中的數(shù)據(jù)沒有經(jīng)過標(biāo)準(zhǔn)化和格式化的處理。所有公式可能都是圖片文件,這就要把這些公式全部轉(zhuǎn)成文本可描述的文件。這就要花很長時間才能完成。像中國可能有兩億道中小學(xué)生題庫,處理完了之后質(zhì)量高的可能不到一千萬道,這是一個很辛苦的數(shù)據(jù)處理過程。當(dāng)然這個過程也會涉及到數(shù)據(jù)清洗、加工、重新整理。最麻煩的是針對質(zhì)量不好的數(shù)據(jù),要想辦法寫工具,把質(zhì)量變好,甚至要雇一批數(shù)據(jù)標(biāo)注人才把數(shù)據(jù)標(biāo)好,這是相當(dāng)麻煩且繁瑣的工作。

另外,在數(shù)據(jù)層面,最重要的不是數(shù)據(jù)加工的能力而是數(shù)據(jù)生產(chǎn)的能力,目前很多數(shù)據(jù)是空白的,尤其是在一些很窄的領(lǐng)域,所以必須生產(chǎn)出來。以音樂數(shù)據(jù)為例,全世界每年能夠生產(chǎn)3億首,其中中國每年就能生產(chǎn)200萬首歌,但實際上可能只有20萬首是標(biāo)注好的,那怎么辦?只能自己花錢加工數(shù)據(jù)。所以現(xiàn)在質(zhì)量高的數(shù)據(jù)是非常稀缺的。

AI科技評論:其實數(shù)據(jù)層面,也會涉及到數(shù)據(jù)合規(guī)的問題?

方漢:首先要有一個正確的心態(tài),我們一直認(rèn)為數(shù)據(jù)合規(guī)和法律監(jiān)管是行業(yè)健康發(fā)展的前提,所以我們一開始就會配合各部門完成數(shù)據(jù)保護(hù)等工作,這是最關(guān)鍵的。我們認(rèn)為有監(jiān)管比沒監(jiān)管好,如果沒有監(jiān)管的話,各種不健康不合規(guī)的東西出來了,行業(yè)的發(fā)展會受限制,企業(yè)的損失也會很慘重。

在出海過程中,中國一些企業(yè)就是因為不重視合規(guī),出現(xiàn)了各種各樣的問題。對于大模型訓(xùn)練來說也是一樣的,最關(guān)鍵的是敏感數(shù)據(jù)不能出境。

我們在東南亞、歐洲等地區(qū)發(fā)展好的原因就在于我們堅決服從監(jiān)管,而且最大限度地配合監(jiān)管部門做事。國內(nèi)也一樣,我們是全國第二家提交大模型審核的企業(yè),北京市第二批通過的。

其實AI這波數(shù)據(jù)保護(hù)法規(guī),各國還在規(guī)劃中。我們也在緊密關(guān)注,會全力配合。中國是大模型落地比較早的國家,所以我們配合得非常好。其他國家可能還沒有完全落地,但我們在持續(xù)關(guān)注。

AI科技評論:美國的持續(xù)封鎖,會不會有算力方面的擔(dān)憂?

方漢:肯定會有影響?,F(xiàn)在業(yè)界出現(xiàn)了兩個新的摩爾定律,一是,出自O(shè)penAI——每18個月人類的知識會翻倍,我對此表示質(zhì)疑;

二是,大模型的訓(xùn)練和推理成本會以每年10倍的速度遞減,也就是說每年的訓(xùn)練成本和推理成本會下降10倍左右,我表示贊同。為什么?因為現(xiàn)在所有人都在拼命優(yōu)化,也出現(xiàn)了很多新的理論,比如最早的文生圖基本15分鐘才能完成,現(xiàn)在4、5秒就能完成了,直接降了60倍。

另外,手機上現(xiàn)在已經(jīng)能跑7B、13B的模型了,5年之后手機上一定能跑80B的模型,所以最后離線推斷一定會成為主流。

AI科技評論:現(xiàn)在國內(nèi)很多企業(yè)還是有算力方面的擔(dān)憂的,國內(nèi)有可替代的嗎?

方漢:華為910B幾乎能達(dá)到A100 85%的性能,主要問題在于他的底層軟件的穩(wěn)定性和硬件的兼容性還在不斷修補中,但是用作推理已經(jīng)沒有任何問題了,訓(xùn)練還差一點,還需要大家陪著它再改一段時間。

國內(nèi)能夠達(dá)到910B水平的一共只有兩三家,但是國產(chǎn)芯片最大的問題是產(chǎn)能,只要產(chǎn)能上去了,肯定能替代。國內(nèi)芯片在設(shè)計上一點也不落后,和A100的差距已經(jīng)不大了,H100和H200還需要時間追趕。(更多關(guān)于大模型行業(yè)的故事,歡迎添加微信 ericahss1224,互相交流,互通有無)

面對競爭:差異化是前提,其次是認(rèn)知

AI科技評論:相對于其他五款產(chǎn)品來說,AI搜索是新產(chǎn)品,為什么選擇搜索這個方向?

方漢:很簡單的邏輯。AI搜索不是憑空產(chǎn)生的,是舊的技術(shù)和大模型技術(shù)結(jié)合后推出的新產(chǎn)品。

其實我們做搜索已經(jīng)有6年的時間了。在這方面的技術(shù)儲備遠(yuǎn)比想象的多,早期我們做Opera News,它的背后其實是有一個搜索引擎支撐的,這個搜索引擎每天可能要收集幾千萬個英文的站點,把新聞抓取下來然后轉(zhuǎn)成用戶可以訪問的,就像今日頭條一樣。所以AI搜索反而是最早ready的。

AI科技評論:除了AI搜索,還有游戲、社交、音樂等產(chǎn)品,這些產(chǎn)品的推出節(jié)奏是什么樣的?

方漢:基本會跟用戶的節(jié)奏走,我們會在用戶端不斷地測試,一旦我們認(rèn)為測試效果、數(shù)據(jù)和用戶的反饋達(dá)標(biāo)了,就會推出來。目前除了AI搜索外,AI音樂、AI動漫、AI社交和AI游戲等產(chǎn)品都在海外市場測試中。

AI科技評論:可以理解為AI搜索主要面向國內(nèi),其他產(chǎn)品面向海外?

方漢:其他五款產(chǎn)品在海外落地成功后,會考慮在國內(nèi)進(jìn)行推廣。

首先全世界付費習(xí)慣最好的市場是歐美,其次是中國。我們首選歐美市場,因為歐美用戶的付費習(xí)慣比較好,目前OpenAI付費最多的用戶也集中在歐美市場。所以會選擇先做價值較大的市場。

AI科技評論:其實現(xiàn)在各大廠都在做產(chǎn)品的重構(gòu),昆侖在這方面有什么不同?

方漢:大家的思路不同,我們一直在做面向C端的端到端的內(nèi)容生產(chǎn)方。

其實從去年我們就一直在思考大模型之后是什么,當(dāng)時我們就預(yù)判了肯定是千模大戰(zhàn),但是在這場戰(zhàn)役中,我們不一定能勝出。所以我們就想清楚了,不做效率工具,只做平臺。這個事情其實比大家想的要早一點。

AI科技評論:關(guān)于C端,大家都在討論超級應(yīng)用,您認(rèn)為距離下一個超級應(yīng)用,還有多長時間?

方漢:肯定有超級應(yīng)用,但不止一個超級應(yīng)用,互聯(lián)網(wǎng)時代誕生了谷歌、亞馬遜、Meta(Facebook),移動互聯(lián)網(wǎng)催生了Snapchat、Twitter,包括國內(nèi)的字節(jié)、美團(tuán)、滴滴等都是超級APP,但沒有一個超級app能把所有超級APP集合起來。所以我認(rèn)為一個超級APP包打天下是不太可能的,未來可能會出現(xiàn)幾個超級APP。

聚焦到具體的領(lǐng)域,游戲和電影一樣不太可能出現(xiàn)超級APP,社交、音樂、動漫等都有可能。

AI科技評論:關(guān)于C端,大家都在討論超級應(yīng)用,您有信心嗎?

方漢:信心肯定得有,我也相信我們一定能做出超級APP。因為我們做的比較早,希望也比較大,但誰也不敢保證100%一定能做成,畢竟機緣巧合的事情太多了。只能說我們會盡力朝著超級APP的方向努力,所以我們一直做平臺,不做工具。因為做工具是做不成超級APP的。

大模型形態(tài)之爭:開源是大趨勢

AI科技評論:除天工外,昆侖還開源了13B模型,好像很多廠商都喜歡把6B、7B或者13B作為一個節(jié)點?

方漢:其實邏輯很簡單,和顯存相關(guān)。4090消費級顯卡的內(nèi)存是24G,6B需要12G,13B需要26G左右。所以6B和13B都是消費級顯卡,大家可以直接拿回去玩,或者供小企業(yè)使用,因為消費級顯卡特別便宜。為什么A100、H100性能高,因為一個是40G內(nèi)存,一個是120G,單卡多少G的內(nèi)存是非常關(guān)鍵的。

這就是為什么蘋果新一代筆記本特別強的原因,因為它能跑到196G。所以最新版本的蘋果電腦理論上可以跑一個300B的模型,只是慢一點而已。

AI科技評論:那為什么參數(shù)大的模型會選擇閉源?是商業(yè)化方面的考慮?

方漢:因為大部分人都跑不起來,你說是為了商業(yè)化考慮嗎?任何一家大模型企業(yè)都要考慮商業(yè)化,這是一件非常正常的事情。實際上最重要的還是底座大模型,一個千億級別的大模型對我們而言,最關(guān)鍵的是技術(shù)機密。在這之上訓(xùn)練出很多小模型開源給大家使用,完全是沒問題的。

AI科技評論:昆侖為什么要選擇開源?怎么看待開源和閉源的關(guān)系?

方漢:我認(rèn)為開源的話,做生態(tài)比較容易,對中小企業(yè)的機會也會更大。

開源和閉源并不矛盾,二者互為有機組成部分。這和做開源公司的leader的商業(yè)模式有關(guān)。

就像Meta(Facebook)屬于后來的攪局者,對他來說,他不依靠大模型,對他的業(yè)務(wù)也沒有致命性的影響,所以他就直接開源了,所以現(xiàn)在開源模型最好的是Meta的LLaMA 2。

目前國內(nèi)大模型還處在誰先發(fā)完全開源的大模型,大家一擁而上的狀態(tài)。我們?nèi)ツ?2月份發(fā)布大模型之后,利用我們的大模型做研發(fā)的企業(yè)特別多。我覺得這是很正常的事。

但我認(rèn)為開源的本質(zhì)是為了構(gòu)建一個良好的生態(tài),讓更多的中小企業(yè)能夠在我們的大模型上開展一些工作。

AI科技評論:現(xiàn)在老生常談的一個話題是,開源怎么掙錢?

方漢:做開源的話,一開始大家確實不知道怎么掙錢。其實開源怎么變現(xiàn)已經(jīng)有一套很成熟的邏輯了。最近MongoDB提出了一個新的邏輯SSPL,他說我開源出來,你可以隨便用,不用給我交錢。但是云廠商不能用這個給別人提供服務(wù)。包括百度、阿里、亞馬遜等云廠商,如果要給別人提供服務(wù)的話,必須付費。

但是因為云計算是一個大的趨勢,大家都希望云廠商來提供服務(wù)。MongoDB的說法是云廠商不許用,只能我來提供云服務(wù),相當(dāng)于把云服務(wù)的版權(quán)卡死了。只有他們能夠提供這項服務(wù),這樣就會很掙錢,像MongoDB每年都有幾十億的營收。(更多關(guān)于大模型行業(yè)的故事,歡迎添加微信 ericahss1224,互相交流,互通有無)

AI科技評論:內(nèi)部產(chǎn)品是在天工閉源大模型上做的,還是在開源模型上做的?

方漢:是在天工底座大模型之上,裁剪出的各種專有小模型上研發(fā)的。

大模型落地:早期蓬勃發(fā)展,且雜亂

AI科技評論:您認(rèn)為大模型想要落地難嗎?

方漢:大模型在B端的落地速度會非??臁R驗橛行〣端企業(yè),尤其是國企、世界500強企業(yè)的付費習(xí)慣極好。很多人說大模型能不能在B端掙錢,就看微軟的股價什么時候漲。因為現(xiàn)在全世界做B端生意的,微軟是走的最好的。

國內(nèi)的話,要看怎么激發(fā)用戶的痛點,比如我們做商品圖片生成,目前很多小企業(yè)、淘寶商家的付費意愿都很強,因為他們找淘寶模特拍一張商品圖片的成本可能是200塊錢到500塊錢,AIGC 2塊錢到5塊錢就能解決,所以淘寶模特和攝影師未來肯定會失業(yè)。

AI科技評論:所以不存在大模型商業(yè)化落地難的問題了?

方漢:當(dāng)然存在,因為現(xiàn)在大模型的能力遠(yuǎn)遠(yuǎn)不夠,他能幫用戶解決的問題也是有限的。

為什么淘寶的商品圖片生成會率先被打破,比如一個身穿大衣的模特,多了根手頭,少了根手指頭,用戶是能容忍的,只要簡單地修一下就可以了。但如果是法律問題,你告訴我這個人應(yīng)該從判3年改到判10年,這就是一個大問題了。所以想要在金融、法律、醫(yī)療等比較嚴(yán)肅的行業(yè)落地還是有難度的。內(nèi)容賽道就比較容易了,比如漫畫畫錯了就畫錯了,大家在這方面的容忍度還是很高的。

現(xiàn)在大模型商業(yè)化還處在早期蓬勃發(fā)展且比較混亂的階段,但這是任何一項新技術(shù)發(fā)展的必經(jīng)之路,如果一開始不雜亂的話,怎么能優(yōu)勝劣汰出現(xiàn)一批真正優(yōu)秀的公司呢。所以說這是一個很正常的現(xiàn)象。

AI科技評論:您認(rèn)為哪些行業(yè)比較容易落地,哪些困難?

方漢:容錯率低的行業(yè)最難進(jìn),容錯率高的行業(yè)很容易進(jìn)。

AI科技評論:三年以來,對大模型有沒有一個改觀?

方漢:大模型的智能能力越來越強,這是我們一開始想不到的,但我認(rèn)為還有很多所謂的局限性。比如智能程度沒有那么高,最難的像3D模型的生產(chǎn)、以及視頻生成技術(shù)還沒有完全解決。

我們堅信未來一定會解決,但對于中小企業(yè)來說,不能等這些問題都解決了再研發(fā)產(chǎn)品,而是要提前做好準(zhǔn)備。

AI科技評論:怎么平衡天工大模型和上層AI產(chǎn)品的關(guān)系,未來會有所側(cè)重嗎?

方漢:首先一個是基礎(chǔ)架構(gòu),一個是上層應(yīng)用,沒有所謂的偏重。

目前大部分應(yīng)用廠商沒有自己的大模型,只能調(diào)用別人的API,這就會出現(xiàn)很多風(fēng)險。比如出現(xiàn)問題時只能先向上反應(yīng),等別人來改。再比如LLaMA是一個英文模型,它的中文語料不夠,所以想要做中文的很難。

好處在于,從大往小做容易。我們能基于底座大模型定制各類行業(yè)模型,加上對大模型有著深刻的認(rèn)知和理解,也能加快做行業(yè)模型的進(jìn)度,無論這個模型的質(zhì)量是不是行業(yè)內(nèi)最好的。

AI科技評論:未來競爭會愈演愈烈,怎么保持競爭優(yōu)勢?

方漢:我們公司相對比較小,部門間的溝通會比較多。所以我們對于大模型的研究會朝著離應(yīng)用更近的方向運行。

大模型的未來:端側(cè)推理將成為下一個爆發(fā)點

AI科技評論:目前國內(nèi)大模型的發(fā)展歸于平淡了,您怎么看?

方漢:很大程度上是因為算力吃緊。訓(xùn)練GPT-3.5只需1000張卡,GPT-4需要5000張卡起步。GPT-5估計要3萬張卡左右。算力不夠很難訓(xùn)出下一代模型。這是很實際的問題。

所以以前是千模大戰(zhàn),現(xiàn)在已經(jīng)變成百模大戰(zhàn)了,未來可能會變成十模大戰(zhàn),我對我們的大模型還是很有信心。

AI科技評論:您認(rèn)為在這波大模型和AIGC浪潮中,最受益的是誰?

方漢:第一波受益的肯定是賣鋤頭的企業(yè),比如做顯卡或者硬件的廠商,下游做光模塊、高速網(wǎng)卡的廠商都會從中受益。

AI科技評論:通用大模型、行業(yè)模型以及應(yīng)用層的難度一樣嗎?分別體現(xiàn)在哪些方面?

方漢:我覺得不一樣,通用大模型的難點在于訓(xùn)練成本和技術(shù)積累。行業(yè)模型的難點在于能否拿到某個垂直行業(yè)的專屬數(shù)據(jù)。比如法律文本,有一部分原來公開過,但并不是所有人能拿到所有的判定文本,這就是專有數(shù)據(jù)。

上層應(yīng)用考驗的則是對行業(yè)以及產(chǎn)品形態(tài)的理解。現(xiàn)在業(yè)內(nèi)有一個普遍的現(xiàn)象,所有的產(chǎn)品經(jīng)理都是蒙的,不知道用AI做什么產(chǎn)品。而所有做技術(shù)的人都在講AI有多先進(jìn),你們可以發(fā)現(xiàn)做演講的都是技術(shù)人才,很少有產(chǎn)品經(jīng)理出來講我用AI做了一種新的商業(yè)模式,但實際上真正有威力的是誰能夠基于AI創(chuàng)造出新的顛覆式的商業(yè)模式。

每個層面的難點不一樣,最簡單的反而是底層大模型,因為只要你有算力,有積累,就一定能做好。

AI科技評論:昆侖萬維最近收購了一個芯片廠商,是為了自己做訓(xùn)練用?還是有其他考量?

方漢:模型訓(xùn)練可能還早一點。但有一個問題,現(xiàn)在端側(cè)算力不夠,就是手機上不夠。vivo前段時間發(fā)布了一個模型,高通發(fā)布了一個能在手機上跑的芯片。所以我們認(rèn)為端側(cè)推理會成為一個大趨勢。尤其是手機?,F(xiàn)在手機賣不動了,為什么?因為攝像頭和顯示屏已經(jīng)卷完了,4G、5G也卷完了,之后大家不知道卷什么了,下一波換機潮一定是AI換機潮,就是端側(cè)推理,因為端側(cè)推理是不需要付錢的,這些錢已經(jīng)包含在了你買手機的錢里,比如買手機能一口氣買斷了多少年的推斷成本。

AI科技評論:也就是說端側(cè)推理,會成為下一波大潮?

方漢:對,下一個爆發(fā)點一定是端側(cè)推理。就像短視頻為什么能起來?是因為4G加攝像頭都卷到了一個臨界點,短視頻起來和4G、攝像頭的卷有密不可分的關(guān)系。

AI卷到最后一定是端側(cè)推理出來后會出現(xiàn)各種驚艷的功能。而且最后所有手機廠商都會拼命營銷,今天你的手機能跑30B,明天我的手機能跑50B,是不是跟卷攝像頭一模一樣?這是我們的一個認(rèn)知。其實這對行業(yè)是一種好事,會倒逼廠商訓(xùn)練7B、13B等小模型。

(雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章

工業(yè)口編輯

關(guān)注新基建,聚焦工業(yè)互聯(lián)網(wǎng)領(lǐng)域 網(wǎng)絡(luò)安全丨微信:15230152798
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說