丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給陳彩嫻
發(fā)送

0

大模型時代的三道鴻溝:數(shù)據(jù)、成本與想象力

本文作者: 陳彩嫻 2023-06-16 10:36
導(dǎo)語:To B or not to B?這是 AI 大模型的「哈姆雷特之問」。

跨入2023年,大模型興起、諸多公司「跑步進(jìn)場」的頭幾個月,大模型一邊倒向 C 端類 ChatGPT 的研發(fā),對成本、效率更敏感的企業(yè)客戶似乎不在關(guān)注焦點(diǎn)。

然而近兩個月,情況發(fā)生了變化。基于醫(yī)療、金融、教育等垂直行業(yè)的大模型開始出現(xiàn)。而已經(jīng)發(fā)布通用大模型的公司,也在針對行業(yè)推出模型服務(wù)。

這將給大模型的市場發(fā)展帶來什么變化?雷峰網(wǎng)

1、MaaS 的疑問

隨著「大模型是AI時代的基礎(chǔ)設(shè)施」的提法深入人心,MaaS(Model as a Service,模型即服務(wù))的概念逐漸廣為人知。簡單來說,用戶可以直接在云端調(diào)用、開發(fā)與部署模型,而無需投資構(gòu)建和維護(hù)自己的模型所需的基礎(chǔ)設(shè)施、硬件和專業(yè)知識。

但從「用家」的角度來看,這一模式還有疑問。雷峰網(wǎng)(公眾號:雷峰網(wǎng))

現(xiàn)任某知名智能家居品牌 CTO 的陳平告訴雷峰網(wǎng),他們的智能產(chǎn)品銷往全球各地,對大模型有突出需求,就是想用大模型來提升多國語言識別與處理的能力。以前的語音識別做不到「一模通用」,而是要根據(jù)不同的國家設(shè)計不同的方案,但 ChatGPT 出來后,他們調(diào)用 API 調(diào)試,發(fā)現(xiàn)大模型能有效地解決這個問題。

在海外,該品牌與亞馬遜進(jìn)行合作。他們的產(chǎn)品本身就需要通過亞馬遜的平臺在海外銷售,亞馬遜自己做的 Echo 音箱也賣到海外很多個國家,驗證了亞馬遜語音識別技術(shù)的成熟度。盡管亞馬遜的效率成本比較高,但能夠較好地滿足他們的需求。但在國內(nèi),他們還不知道該用哪一家的模型:目前國內(nèi)已發(fā)布的大模型數(shù)量太多,如果他們要將所有的模型都驗證一遍、一一對比模型的效果,那么所消耗的人力成本會非常大。

國內(nèi)模型能力的「賣方」可分為兩類:一類是BAT等大廠和大模型初創(chuàng)公司(如智譜、MiniMax)為主;此外還有大模型的「中間商」,主要是基于大模型開發(fā)應(yīng)用型服務(wù)的創(chuàng)始團(tuán)隊,包括底層算力與框架的提供者,甚至還包括提供大模型微調(diào)的第三方公司。

陳平的想法,反映了部分B端大客戶的需求,他們希望有一個專屬于自身行業(yè)的大模型,這正好介于兩類賣方所提供的產(chǎn)品與服務(wù)之間。

一位大廠工程師在與雷峰網(wǎng)的交談中,將市場需求分為金字塔的底層、中層與上層:

  • 底層是通用大模型,如 ChatGPT。據(jù)不完全統(tǒng)計,過去三個月里,國內(nèi)發(fā)布了超過 70 個 To C 通用大模型產(chǎn)品,如百度的文心一言、阿里的通義千問、科大訊飛的星火等等。

  • 中層是行業(yè)大模型,如彭博發(fā)布的金融大模型 Bloomberg GPT,這類大模型或是與底層想做大模型基礎(chǔ)設(shè)施的通用大模型廠商合作定制,或直接調(diào)用 API 接口,或大廠云廠商自研。

  • 上層是一系列應(yīng)用型服務(wù),基于通用大模型或行業(yè)大模型開發(fā) AI 工具,如構(gòu)建一個專注于論文解讀(含翻譯、摘要總結(jié)、生成等等)的學(xué)術(shù)平臺。

從數(shù)據(jù)安全的角度看,陳平更青睞與大廠合作,因為第三方公司雖然懂得訓(xùn)練大模型,但不懂智能家居的知識,他們依然要提供大量的數(shù)據(jù)給對方訓(xùn)練,而數(shù)據(jù)提供過去后,他們一是無法保障模型的能力得到延展,二是無法避免第三方公司將這些數(shù)據(jù)與對應(yīng)的模型賣給陳平所在品牌的競爭對手。

當(dāng)理論落地現(xiàn)實,陳平的困境也是許多 B 端企業(yè)的共同難題。

2、重回焦點(diǎn)

過去三個月,國內(nèi)大模型產(chǎn)品設(shè)計一味追隨 ChatGPT,將問題的定義交給用戶自由發(fā)揮(俗稱「AI 召喚師」),造成了嚴(yán)重的同質(zhì)化,大模型的應(yīng)用局限于文本生成、代碼生成等通識屬性強(qiáng)的場景上,滿足用戶社交、娛樂或創(chuàng)作的需求。

更接近生產(chǎn),對于成本效率要求更高的產(chǎn)業(yè)市場,并未被過多提及。

今年 5 月份,陳平曾經(jīng)嘗試聯(lián)系一家大廠的大模型團(tuán)隊,希望探討大模型落地方案,得到的回復(fù)是優(yōu)先級不在智能家居行業(yè)。

但眼下,大廠和創(chuàng)業(yè)公司們正在將眼光重新聚焦于產(chǎn)業(yè)。

之前,國內(nèi)類 ChatGPT 的大模型產(chǎn)品都無一例外地側(cè)重「對話交互型」,而非「知識增強(qiáng)型」,大多數(shù) C 端用戶與 AI 的對話內(nèi)容趨向于「Chat」(閑聊)而非「GPT」(生成/創(chuàng)造)。但另一方面,C 端用戶的付費(fèi)意愿低,To C 的通用大模型產(chǎn)品短期內(nèi)無法復(fù)制 ChatGPT 的成功模式,在同質(zhì)化產(chǎn)品的圍攻下被迫加入資源競賽的燒錢游戲?;剡^頭看,To B 客戶付費(fèi)意愿高。隨著市場回歸理性,大模型選擇 To B 幾乎成為行業(yè)內(nèi)心照不宣的一個范式。

有報告指出,B端的Mass服務(wù)需要針對行業(yè)領(lǐng)域和業(yè)務(wù)場景進(jìn)行大量工程工作,但B/G端客戶付費(fèi)能力更強(qiáng),未來盈利空間以及成長空間廣闊。

但To B客戶的需求也更「強(qiáng)勢」,一不小心走歪,很可能回到上一代 AI 模型定制化的老路。

例如,市面上已經(jīng)出現(xiàn)了一些專門提供模型精調(diào)服務(wù)的第三方公司。

雷峰網(wǎng)了解到,這類第三方公司采用一次性開發(fā)+訂閱的收費(fèi)模式,如初始研發(fā)費(fèi)用 100 萬、再加上終身授權(quán)許可的設(shè)備費(fèi)用(8塊錢一個),幫助 B 端客戶根據(jù)需求訓(xùn)練出滿足它們行業(yè)需求的大模型,然后在客戶的平臺上進(jìn)行私有化部署。因為在市面上暫時找不到合適的標(biāo)化產(chǎn)品,這類公司受到了沒有自主研發(fā)團(tuán)隊、同時又渴求大模型能力的B 端企業(yè)客戶(區(qū)別于大 B)的青睞。


3、兩個盲區(qū)

雷峰網(wǎng)也關(guān)注到,越來越多大模型的研發(fā)團(tuán)隊準(zhǔn)備彎道超車,繞過激烈的C端市場,專注研究面向行業(yè)的大模型,如王小川建立的百川智能就剛剛推出了一個參數(shù)規(guī)模 7B的開源商用模型。

騰訊也計劃在 6 月 19 日發(fā)布行業(yè)大模型及商用訓(xùn)練平臺。在此前4月,騰訊發(fā)布了的面向大模型訓(xùn)練的新一代HCC高性能計算集群,整體性能比過去提升了3倍,并通過騰訊云MaaS面向企業(yè)輸出模型訓(xùn)練相關(guān)服務(wù)。雷峰網(wǎng)

看起來,騰訊沒有急于推出聊天助手產(chǎn)品,而是選擇了通用大模型、行業(yè)大模型兩條腿走路,進(jìn)一步對外釋放行業(yè)大模型服務(wù)能力。在剛剛結(jié)束的中關(guān)村論壇上表示,李彥宏提出未來每一個行業(yè)都會有屬于自己的大模型。大模型會深度融合到實體經(jīng)濟(jì)當(dāng)中去,賦能千行百業(yè),助力中國經(jīng)濟(jì)開創(chuàng)下一個黃金30年。阿里公布的模型即服務(wù)三層架構(gòu)中,也涵蓋了企業(yè)專屬大模型。

可以看出,企業(yè)客戶對大模型落地很迫切,各類廠商與創(chuàng)業(yè)者也在追趕需求。

事實上,B 端企業(yè)客戶往往自帶場景與數(shù)據(jù),是大模型落地的最佳檢驗場。那么,在大模型的落地上,企業(yè)客戶最關(guān)心什么?

據(jù)雷峰網(wǎng)調(diào)研,大模型在企業(yè)落地有兩個盲區(qū):一是數(shù)據(jù)安全,二是成本可控。數(shù)據(jù)安全包含「數(shù)據(jù)隱私」與「專業(yè)知識」兩塊,行業(yè)人士認(rèn)為,ChatGPT 生成的答案應(yīng)該由相關(guān)領(lǐng)域的專業(yè)人士判斷?;谕ㄓ么竽P?,目前用戶并非將專業(yè)知識輸入模型后就能得到專業(yè)的結(jié)果。此外,陳平指出,應(yīng)用型的公司基本不愿意將自身微調(diào)的模型貢獻(xiàn)到公有版本里與其他人分享,所以企業(yè)還是傾向于訓(xùn)練自己的大模型。訓(xùn)練完后在本地進(jìn)行私有部署。

行業(yè)現(xiàn)有的通常做法是,提供一個通用大模型,然后開放給行業(yè)的客戶去微調(diào),再進(jìn)行私有化部署。可陳平的經(jīng)驗是,以 Open AI 為例,雖然它們開放了 API,但API無法私有化部署,客戶無法在最新的模型版本上微調(diào);大模型的技術(shù)變化太快,對企業(yè)來說,跟上潮流的成本太高。

一家企業(yè)的CTO向雷峰網(wǎng)表示,目前大模型在企業(yè)落地的成本分兩塊:一是模型前期微調(diào)與訓(xùn)練的成本,二是模型后期與業(yè)務(wù)結(jié)合的運(yùn)行成本。大模型的訓(xùn)練需要算力、數(shù)據(jù)與工程等幾塊體系的支持?!钙髽I(yè)要考慮訓(xùn)練定制化模型的人力與時間成本,更傾向于選擇能同時提供兩種能力的廠商,將模型訓(xùn)練與運(yùn)行成本降到最低。」

一個值得警惕的點(diǎn)是:目前看來,并非所有的場景都適合大模型落地。大模型剛火起來時,一些行業(yè)與未及時推出大模型技術(shù)或產(chǎn)品的公司擔(dān)心自身業(yè)務(wù)被大模型改寫,觀望兩個月后,他們發(fā)現(xiàn)「自己想多了」。他們認(rèn)為,原因可能有兩塊:一是缺少提出好問題的 AI 產(chǎn)品經(jīng)理,二是大模型的技術(shù)屬性所限。找場景一直是技術(shù)公司的難題,同樣也是 To B 的難題。大模型團(tuán)隊尋找合適的場景,也是深入 To B 服務(wù)的關(guān)鍵一步。

每個掌握大模型自研能力的公司都想做大模型時代的「基礎(chǔ)設(shè)施運(yùn)營商」。三個月下來,行業(yè)目前只能確定,如果大模型真的是 AI 時代的智能運(yùn)營商,如水電網(wǎng)等社會基礎(chǔ)設(shè)施,無論現(xiàn)有的行業(yè)玩家再多,最終也只有少數(shù)幾家能成功。

先發(fā)有先發(fā)制人的優(yōu)勢,后發(fā)有后來居上的可能,大模型驅(qū)動新生產(chǎn)力的游戲還在繼續(xù)。如果大模型真的代表一個新時代,行業(yè)集體多花點(diǎn)時間進(jìn)行深入思考也無可厚非,目前看來,繼續(xù)留在牌桌上就已經(jīng)是正確的一步。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

大模型時代的三道鴻溝:數(shù)據(jù)、成本與想象力

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說