丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給董子博
發(fā)送

0

Llama 3受美國(guó)市場(chǎng)冷落,開(kāi)源模型還香嗎?

本文作者: 董子博 2024-08-25 13:12
導(dǎo)語(yǔ):據(jù)報(bào)道,Llama3.1上線一個(gè)月后,下載量?jī)H為360萬(wàn),比上一代模型降低了40%。

Llama 3受美國(guó)市場(chǎng)冷落,開(kāi)源模型還香嗎?

作為開(kāi)源大模型的頂梁柱,Llama3正在遭遇冷落。 

近日,據(jù)美國(guó)媒體The Information報(bào)道,Llama在全球最大的云計(jì)算服務(wù)供應(yīng)商亞馬遜的AWS平臺(tái)上備受冷落,與之相對(duì),Anthropic的閉源模型Claude才是該平臺(tái)上最受歡迎的模型。報(bào)道稱(chēng),在另一家云平臺(tái)微軟Azure上,Llama也并非微軟的銷(xiāo)售首選。

 Llama 3受美國(guó)市場(chǎng)冷落,開(kāi)源模型還香嗎?

一個(gè)月前,Meta發(fā)布了最新的開(kāi)源大模型Llama 3.1 405B,在測(cè)試中性能追平GPT-4o??上?,測(cè)評(píng)中的優(yōu)異成績(jī)沒(méi)能反映在市場(chǎng)上,據(jù)報(bào)道,Llama3.1上線一個(gè)月后,下載量?jī)H為360萬(wàn),比上一代模型降低了40%。

門(mén)檻高效率低,開(kāi)源模型“才是最貴的”

這一現(xiàn)象早有預(yù)兆。早在今年4月,Llama 3推出70B和400B模型之后,就有開(kāi)發(fā)者反饋“免費(fèi)的才是最貴的”,Llama 3“根本用不起”的現(xiàn)象。

 當(dāng)時(shí),一位美國(guó)AI創(chuàng)業(yè)者Arsenii Shatokhin的采訪視頻在網(wǎng)上流傳,這位創(chuàng)業(yè)者表示,“我們只有一兩個(gè)客戶有足夠資源,來(lái)精調(diào)或運(yùn)行700億參數(shù)的Llama開(kāi)源模型?!?/p>

Llama 3受美國(guó)市場(chǎng)冷落,開(kāi)源模型還香嗎?

訪談中,這位AI智能體公司VRSEN的創(chuàng)始人指出,企業(yè)自己運(yùn)行開(kāi)源大模型的效率遠(yuǎn)低于使用閉源大模型。他分析出兩個(gè)原因:

1) 首先,開(kāi)源模型多數(shù)需要企業(yè)自己下載后運(yùn)行,隨著模型參數(shù)向百億、千億不斷攀升,對(duì)本地IT設(shè)施要求也隨之提高,大量企業(yè)并不具備與之匹配的充足資源;

2) 其次,與做好精調(diào)和商業(yè)化適配的閉源模型不同,如果使用開(kāi)源模型,企業(yè)還要再做優(yōu)化,需要公司內(nèi)部有足夠的技術(shù)人才和技術(shù)設(shè)施,對(duì)企業(yè)的技術(shù)能力無(wú)疑是提出了更高要求。

“我們只會(huì)向具備數(shù)據(jù)專(zhuān)業(yè)知識(shí)的客戶推銷(xiāo)Llama,比如內(nèi)部有工程師和數(shù)據(jù)科學(xué)家的公司?!睋?jù)The Information報(bào)道中,微軟員工這樣向媒體表示。

正如百度創(chuàng)始人李彥宏在近期的上海世界人工智能大會(huì)上表示,開(kāi)源模型在學(xué)術(shù)研究、教學(xué)領(lǐng)域有一定價(jià)值,能夠讓學(xué)術(shù)界更熟悉大模型的工作機(jī)制、形成理論;但在大多數(shù)的應(yīng)用場(chǎng)景中,開(kāi)源模型并不合適,尤其是在激烈的商業(yè)化競(jìng)爭(zhēng)中,只有閉源模型,才能讓企業(yè)的業(yè)務(wù)效率更高、成本更低。

缺乏商業(yè)驗(yàn)證,開(kāi)源模型將越來(lái)越落后

近期,開(kāi)源和閉源模型之爭(zhēng)一直備受行業(yè)關(guān)注,尤其是在時(shí)時(shí)更新的“測(cè)評(píng)跑分”上,每當(dāng)新一代大模型誕生、領(lǐng)跑測(cè)評(píng)榜時(shí),就會(huì)爆出“開(kāi)源大模型超越閉源”或“閉源大模型保持領(lǐng)先”的各類(lèi)說(shuō)法。

但迄今為止,閉源模型性能整體領(lǐng)先于開(kāi)源。在斯坦福大學(xué)7月公布的大規(guī)模多任務(wù)語(yǔ)言理解 (MMLU)測(cè)試排名中,排名前十的模型中,僅有Llama 3.1為開(kāi)源,其余9款上榜模型均為閉源。

Llama 3受美國(guó)市場(chǎng)冷落,開(kāi)源模型還香嗎?

某種程度上,這與開(kāi)源模型并非“真開(kāi)源”有關(guān)。有多位開(kāi)發(fā)者表示,當(dāng)前的開(kāi)源大模型并非與開(kāi)源軟件不同,僅僅是開(kāi)放了參數(shù)和調(diào)用接口,在使用中既存在需要SFT精調(diào)、優(yōu)化的問(wèn)題,還無(wú)法像真開(kāi)源的Linux那樣看到底層代碼。

因此,大模型的開(kāi)源并不能帶來(lái)模型效果的提高?!伴_(kāi)源模型和閉源模型相比,存在性能差距,這種差距將繼續(xù)擴(kuò)大?!惫雀枨癈EO施密特在采訪中指出。據(jù)介紹,谷歌投資的法國(guó)Mistral公司此前推出過(guò)開(kāi)源模型,但從今年2月起,已經(jīng)轉(zhuǎn)向了閉源模型。

在實(shí)用性方面,伴隨著Llama 3的“叫好不叫座”,開(kāi)源模型更是與閉源模型拉開(kāi)了差距。有多位開(kāi)發(fā)者表示,大模型的進(jìn)步與實(shí)際應(yīng)用密不可分,只有真實(shí)應(yīng)用才能不斷為模型提供反饋,讓模型在響應(yīng)速度、參數(shù)大小等方面不斷優(yōu)化。

隨著商業(yè)化的失速,缺乏商業(yè)驗(yàn)證的開(kāi)源模型,勢(shì)必會(huì)逐步掉隊(duì)。


雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))


雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)