丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給陳彩嫻
發(fā)送

0

文心一言發(fā)布:GPT-4的「搶跑」與中國版ChatGPT的「長跑」

本文作者: 陳彩嫻 2023-03-16 16:36
導語:AI 基建的分水嶺,最終會體現(xiàn)在「云」上。

今天,OpenAI 正式官宣 GPT-4,其中值得關(guān)注的點有兩個:

第一點是,對比 ChatGPT,GPT-4 的智能水平有了進一步的提升。

AI 在特定領(lǐng)域超越人類專家,在模擬律師考試中,ChatGPT 排名末尾 10%,但 GPT-4 在短短時間內(nèi)卻進步到 Top 10%。現(xiàn)場演講中,OpenAI 甚至展示了 GPT-4 處理稅收問題的能力,假設(shè) Alice 與 Bob 結(jié)婚后,收入 XXX,問 2018 年標準扣稅額是是多少,GPT-4 能快速得到準確答案。

另一點是,OpenAI 在 GPT-4 的論文中強調(diào)了 AI 基礎(chǔ)設(shè)施的開發(fā)與優(yōu)化。OpenAI 的官方博客闡明,GPT-4 是在微軟 Azure AI 超級計算機上訓練的。為了 GPT-4 能觸達全球用戶,Azure 云平臺的基建專門進行了 AI 方向的優(yōu)化。

繼 ChatGPT 之后,GPT-4 的發(fā)布,讓 AI 與云的關(guān)系更進了一步。

AI 越火,以ChatGPT 為代表的大模型越火,云服務(wù)的任務(wù)就越急迫。GPT-4 的發(fā)布,短期內(nèi)會加劇這一局面,從長期來看,AI 與云的配合、算力、算法、數(shù)據(jù)的協(xié)同,才是留給國內(nèi)投身智能計算的廠商需要打磨的地方。

GPT-4 的推出,對于「中國的 ChatGPT」們(尤其是即將發(fā)布的「文心一言」)來說自然是搶跑;但如果將 AI 視為一場長跑,我們只要跑起來就有機會——在國外友商推出一項從 0 到 1 的技術(shù)后,把這項技術(shù)玩出「花」來,實現(xiàn)從 1 到 100 的跨越是國內(nèi)廠商們的強項;而這一切的關(guān)鍵,則取決于我們的基礎(chǔ)技術(shù)建設(shè),是否足夠消化這項技術(shù)。

而細究緣由,這是行業(yè)所趨,也是技術(shù)發(fā)展的客觀規(guī)律。


一、AI「三分天下」,云成為分水嶺

生物學上,靈長類動物大腦皮層的神經(jīng)元數(shù)量與通用智能水平成正比;人類的神經(jīng)元數(shù)量為 163 億個,約為大猩猩的 1.8 倍,恒河猴的 9.6 倍,前者在認知與理解世界的智能層面明顯高于高兩者。

一項研究(如下)也表明,當模型的規(guī)模達到一定程度后,大量的智能能力才具備「涌現(xiàn)」的基礎(chǔ)?;谝酝难芯?,AI 界對大模型的研究將繼續(xù)往規(guī)模拓展上努力。盡管越往后、邊際效益愈加遞減,但行業(yè)普遍的共識是:大模型的開發(fā)還遠遠沒有到頭。

換言之,以大模型驅(qū)動的 AI,會是接下來五年、甚至十年的 AI 主題。

文心一言發(fā)布:GPT-4的「搶跑」與中國版ChatGPT的「長跑」

圖源:谷歌論文「Emergent Abilities of Large Language Models」

基于這個前提,我們就不得不聚焦于大模型研究的高門檻:如果說深度學習的基石是數(shù)據(jù)、算法與算力三駕馬車,那么大模型則是大數(shù)據(jù)、精算法與大算力三駕航母,成本高、技術(shù)刁、工程難。能玩得起大模型的,必須是有人、有錢、有時間。因此,小企業(yè)與創(chuàng)業(yè)團隊基本無法「自研」,類 ChatGPT 的鑰匙只會握在資源雄厚的大廠手中。

GPT-3 剛出現(xiàn)時,大模型的這一特質(zhì)還被行業(yè)詬病。但從去年 8 月 Stable Diffusion 、Midjourney 與百度「文心一格」等掀起的文生圖熱浪開始,由大廠帶頭推動 AI 生態(tài)建設(shè)的聲音開始出現(xiàn)。有行業(yè)人士開始改口,認為科技巨頭的入局有利于推動底層模型的進一步優(yōu)化。同時,越來越多的創(chuàng)業(yè)團隊也放棄了「自研」大模型,轉(zhuǎn)而希望像 OpenAI 依傍微軟一樣,與國內(nèi)的 AI 大廠(如百度、阿里、華為等等)建立合作。

在這種情況下,國內(nèi)以語言大模型為中心的智能時代,在起步階段就出現(xiàn)了「三分天下」的局面:

首先是以百度、阿里等為代表的互聯(lián)網(wǎng)大廠,因為在深度學習的 AI 研究基礎(chǔ)上有雄厚積累,同時從2020年 GPT-3 出現(xiàn)后就開始加注大模型,有人才、又燒得起錢(如百度過去十年的研發(fā)投入是1000億),因此被 ChatGPT 的觀望者們視為國產(chǎn)大模型開發(fā)的領(lǐng)軍力量,以及大模型服務(wù)的「供應(yīng)商」。

其次是希望站在開源大模型的肩膀上的行業(yè)團隊。這當中,又可以分為兩類團隊:一是懂大模型開發(fā)、但沒有足夠資源的 AI 公司,他們最終會像 OpenAI 一樣與大廠合作;二是不懂大模型開發(fā)、但懂行業(yè)痛點的非技術(shù)團隊,他們希望用 ChatGPT 相關(guān)的技術(shù)去解決行業(yè)問題,如售前售后、私人家教、論文翻譯與解讀等等。這一類,是大模型的「淘金者」。

最后是間接受益于大模型的 B/C 端用戶。ChatGPT 與其他的 AI 大模型(如決策、視覺、多模態(tài))會為他們的生產(chǎn)與生活帶來智能提升。以百度「文心一格」等 AI 作畫產(chǎn)品為例,AI 小白用戶也能通過輸入簡單的一句話 Prompt(提示)「召喚」AI 快速畫出質(zhì)量高的圖像,豐富了數(shù)字圖像內(nèi)容創(chuàng)作的方法??梢韵胂?,國內(nèi)若推出類 ChatGPT (如百度即將發(fā)布的「文心一言」)產(chǎn)品也將為用戶獲取信息、優(yōu)化工作流程等帶來極大的便利。而大模型在與行業(yè)結(jié)合、與個人用戶交流的過程中,又會獲取更多高質(zhì)量的數(shù)據(jù),變得更智能。

換言之,大模型驅(qū)動下,AI 時代的模型與算法會成為像核電、煤電、風電一樣的資源。發(fā)電廠不會把發(fā)電的能力賣給用電的人;用電的人也沒必要自己買一個發(fā)電機,因為發(fā)電廠供電又穩(wěn)定又安全。而在這種情況下,只有「云+API」的方式才能形成強者愈強的馬太效應(yīng)。

有行業(yè)人士就分析:

各巨頭公司應(yīng)該會各自為戰(zhàn),利用好自己的資源優(yōu)勢,構(gòu)建自己的服務(wù)能力,以 API 的方式賣給中小企業(yè)和政府做應(yīng)用開發(fā)(像現(xiàn)在的云和以前的水電),同時自己的垂域產(chǎn)品也會做相應(yīng)升級,確保對應(yīng)的營收和用戶規(guī)模持續(xù)增長。

也就是說,在 ChatGPT 的淘金熱中,科技巨頭不僅是「淘金者」,還是「賣鏟人」。

當穩(wěn)健安全可控、低成本高效率的 AI 模型服務(wù)成為巨頭們要占領(lǐng)的下一個商業(yè)摩天嶺,如何提升「云」的智能計算水平成為關(guān)鍵;其背后的基礎(chǔ)設(shè)施,如芯片、框架、算法及應(yīng)用,直接關(guān)乎成本與效率,也成為兵家必爭之地。


二、AI 時代,云要「智能」

由于大模型的研究特征,計算的「智能」需求也是必然趨勢,類 ChatGPT 的商業(yè)角逐最終也落在了云的競爭上。

OpenAI 曾有一個很有意思的數(shù)據(jù)統(tǒng)計:2016 年,OpenAI 員工總數(shù) 52 人,平均年薪不到百萬人民幣,云計算一欄的支出是 232.9 萬美元左右;但到 2019 年,OpenAI 的員工整體薪酬仍遠低于市場價,云計算的支出卻已經(jīng)增加到了 3100 萬美元,翻了 13 倍之多。

這說明,在 AI 的研究發(fā)展中,基礎(chǔ)設(shè)施比人貴,云計算的需求增速更快、商業(yè)空間無可限量。同時,在新的十年,誰能為 AI 支持算力,誰就能成為下一個領(lǐng)跑者。

在這一戰(zhàn)中,百度智能云是最早在云上布局 AI 能力、將 AI 與云捆綁售賣的云廠商之一。而由于十多年在 AI 領(lǐng)域的持續(xù)研發(fā)投入,在 ChatGPT 開啟的新 AI 時代中,AI 的底層能力似乎也開始反向助推百度在云計算服務(wù)上的優(yōu)勢,扭轉(zhuǎn)國內(nèi)現(xiàn)有的云布局。

2012年深度學習席卷時,百度是國內(nèi)最早注意到這個風向的科技公司。當年,「深度學習之父」Geoffrey Hinton 開公司拍賣,有四家企業(yè)在競標中窮追猛打,其中一家、也是唯一的一家中國公司,就是百度(另外三家分別是谷歌、微軟與DeepMind)。

2013年,百度建立了中國第一個深度學習研究院(IDL)。作為國內(nèi)最早進入深度學習領(lǐng)域的互聯(lián)網(wǎng)大廠,百度在 AI  上十年投入 1000 億,2016年開源出首個國產(chǎn)深度學習框架PaddlePaddle(飛槳),是國內(nèi)至今唯一能與國際兩大主流框架 TensorFlow 和 PyTorch 正面交鋒的深度學習框架;大模型上,2021年發(fā)布百億參數(shù)中英雙語大模型 PLATO-X、千億參數(shù)大模型「百度·文心」,2022年又發(fā)布知識增強大模型 Ernie……

由于很早開始訓練深度學習模型,百度在計算資源的布局上也極早考慮到了 AI 的需求。

據(jù)了解,2012年,百度就在李彥宏的老家山西陽泉建了一個計算中心,2014年開始分批投入使用,2018年全部交付。百度陽泉計算中心擁有600多項自主研發(fā)技術(shù)專利,包含「冰山」冷存儲服務(wù)器和 X-MAN 超級 AI 計算平臺等自研計算系統(tǒng),每秒可以完成 2000 萬億次深度神經(jīng)網(wǎng)絡(luò)計算。

建成后,百度在陽泉的計算中心一直是只跑百度自己的業(yè)務(wù),比如搜索、網(wǎng)盤、自動駕駛、生物計算等,在各種 AI 場景下均有磨練。2022 年 12 月底,百度正式將陽泉計算中心升級為「智算中心」后,開始對外提供 AI 的智算需求服務(wù)。據(jù)了解,目前百度智算中心在現(xiàn)有千卡并行環(huán)境下可以實現(xiàn)加速比90%,做到單機群萬卡規(guī)模,有效支持大規(guī)模訓練場景。

文心一言發(fā)布:GPT-4的「搶跑」與中國版ChatGPT的「長跑」

百度陽泉智算中心

目前國內(nèi)多個智算中心里,阿里烏蘭察布智算中心的算力為 3 EFLOPS,商湯上海臨港計算中心的峰值算力為 3.74 EFLOPS,而百度陽泉智算中心的算力可達到 4 EFLOPS。

內(nèi)部消息,百度即將發(fā)布的「文心一言」一部分也是在陽泉智算中心計算。陽泉智算中心專門搭建了一個機房去支持「文心一言」的運行,目前正在封閉壓力測試中,即將上線。此前,陽泉已支持文心大模型、文心一格等 AI 產(chǎn)品的計算需求。

目前,陽泉智算中心也是亞洲最大的單體智算中心。在多項自研制冷技術(shù)的加持下,百度陽泉智算中心的 PUE 值降到了 1.08,排名全國第一。更低的能耗意味著更低的成本,價格的優(yōu)勢也最終體現(xiàn)在對外的云服務(wù)上。雷峰網(wǎng)(公眾號:雷峰網(wǎng))

更值得一提的是,百度智能云在 2022 年推出了端到端的 AI 基礎(chǔ)設(shè)施——「AI 大底座」,可以提供 AI 模型開發(fā)的全棧服務(wù)。在百度的「AI 大底座」上,企業(yè)不用有很高的 AI 開發(fā)能力,也無需投入大量成本建設(shè)企業(yè)的 AI 基礎(chǔ)設(shè)施,只需把精力和成本放在自身業(yè)務(wù)場景的打磨上,AI開發(fā)的全流程都可以交給百度“AI大底座”來完成。

傳統(tǒng)來說,AI 算法的開發(fā)部署需要經(jīng)過四大環(huán)節(jié):數(shù)據(jù)處理、算法訓練、芯片適配計算與應(yīng)用開發(fā),其中,訓練算法的框架與芯片是壁壘環(huán)節(jié)。百度的「AI 大底座」在芯片環(huán)節(jié)布置了自研的昆侖芯、框架環(huán)節(jié)布置了飛槳,模型層則有文心大模型等,頂層應(yīng)用還開發(fā)出 AI 數(shù)字人、AI 質(zhì)檢等應(yīng)用,打通了 AI 開發(fā)一整套流程,且每一環(huán)單獨拿出來都很扛打。

文心一言發(fā)布:GPT-4的「搶跑」與中國版ChatGPT的「長跑」

圖注:百度 AI 大底座架構(gòu)圖

ChatGPT 出來后,大家的關(guān)注點集中在算力的數(shù)量與成本上,這一點毋庸置疑。但長期來看,大模型與 ChatGPT 最終必然會沉淀到行業(yè)中去解決實際問題。這時候,「模型即(商品)服務(wù)」的概念下,將 AI 模型包裝成易用可得的商品的能力就成為決勝關(guān)鍵。

而「AI 大底座」猶如方塊拼湊,設(shè)計的靈活度就恰到好處。

如果小模型時代,AI 的智能是一年級學生的水平,那么大模型時代,AI 的智能則相當于高中生。不同的智能水平,必然驅(qū)動不同的應(yīng)用需求,未來的 AI 應(yīng)用場景與 AI 開發(fā)流程也將很可能發(fā)生巨變。也就是說,ChatGPT、乃至 AGI 的應(yīng)用開發(fā)面臨極大的不確定性。

百度在芯片、框架、算法與應(yīng)用方面,均有 AI 能力,能應(yīng)對產(chǎn)業(yè)的更多需求:

?面向有一定 AI 開發(fā)團隊的大企業(yè),百度可以提供「AI 大底座」中的其中一環(huán)或多環(huán)能力,如飛槳+昆侖,或飛槳+文心,或昆侖+文心;

?面對 AI 基礎(chǔ)設(shè)施較差的傳統(tǒng)行業(yè),百度的「AI 大底座」可以提供全流程、端到端的 AI 開發(fā)服務(wù)。加上百度有 EasyDL 的全自動開發(fā)實踐,此前基于大底座,百度智能云已經(jīng)積累了 11 個行業(yè)大模型的訓練與計算經(jīng)驗,可以幫助客戶定制場景服務(wù)。雷峰網(wǎng)

據(jù)了解,百度智能云的戰(zhàn)略是「云智一體,深入產(chǎn)業(yè)」,強調(diào)云與 AI 能力的結(jié)合,并深入產(chǎn)業(yè)的具體場景,用云與 AI 解決產(chǎn)業(yè)生產(chǎn)環(huán)節(jié)中的實際問題,幫助企業(yè)實現(xiàn)智能化轉(zhuǎn)型,而不是簡單提供存儲與計算能力。雷峰網(wǎng)

雷峰網(wǎng)觀察到,百度在 2021 年年底打磨出文心大模型后,就開始對產(chǎn)業(yè)輸出。百度的輸出模式是:首先服務(wù)行業(yè)大客戶,通過解決大客戶的棘手難題積累數(shù)據(jù)與經(jīng)驗,沉淀到「AI 大底座」的模型層中;然后,將已經(jīng)實踐過的行業(yè)大模型能力復制到行業(yè)內(nèi)的其他客戶場景中,實現(xiàn)模型的泛化。

這套模式在大模型時代尤其具有商業(yè)可行性。

舉個例子,百度與國家電網(wǎng)合作巡檢項目,通過無人機搜集山頭電線桿的圖像后返回數(shù)據(jù)中臺進行處理與算法優(yōu)化,新訓練的「電力大模型」算法識別準確率能提升 30%、效率提升 5 倍。在小模型時代,一個 AI 算法在東北三省也許適用,但遷移到南方就需要重新訓練;但在大模型時代,遷移到另一個地方時,只需要在當?shù)夭杉倭繑?shù)據(jù)進行低成本調(diào)優(yōu),「電力大模型」就可以直接上崗。

大模型打磨地越多,復制成本越低,后面的客戶就越用越好。在智能時代,云的定義發(fā)生了改變:以前云是資源,按需索取;現(xiàn)在,云需要搭載 AI 技術(shù)變成生產(chǎn)力,解決企業(yè)招聘部分崗位難、降低企業(yè)用人成本等,轉(zhuǎn)化為可見的效率。

細數(shù)國內(nèi)云廠商的 AI 能力,隨著「云+AI」的模式逐漸占據(jù)主流,過往在 AI 研發(fā)上投入不足的云廠商正在智能計算的奔跑中退后。百度智能云起步晚、市場占有率低,但改變了戰(zhàn)斗方式,逐步體現(xiàn)出了 AI 時代的差異化競爭優(yōu)勢,將自己打造成智算時代最接近用戶需求的一朵云。

ChatGPT 的風波,在云的市場,分流出了一條新的路:云智一體,勢不可擋。在這次 AI 時代的搶跑中,百度確實迎來了新的機遇。


三、「賣鏟人」也是「淘金者」

據(jù)了解,百度大模型為其內(nèi)部產(chǎn)品的效果提升做出了肉眼可見的貢獻。

一個數(shù)據(jù)統(tǒng)計是,在百度文心大模型的加持下,百度搜索的問題分類準確率提升 4.5%,新聞去重召回率提升 8%,視頻推薦召回率提升 10%,小度的意圖理解準確率提升了3.1%。

百度既是「淘金者」,也是賣淘金工具的人。只有了解淘金的難點,才能賣好工具。

消息稱,百度發(fā)布文心一言后,將通過百度智能云對外提供服務(wù),逐步將文心一言的能力落地到生產(chǎn)的實際場景中。未來,不管是 API 的調(diào)用,還是場景的定制,都是通過云去統(tǒng)一對外輸出。

從前,云廠商之間的競爭主要體現(xiàn)在比較誰能夠在最短的時間內(nèi)響應(yīng)客戶需求。算力越精準,客戶的成本越低。但人工智能時代來臨后,AI 會衍生出許多生態(tài)的問題,光比彈性已經(jīng)意義不大。未來,客戶需要的也不再只是一張能訓練 AI 的GPU,而是一整套 AI 解決方案。

ChatGPT 打造了云的分水嶺,這一戰(zhàn),百度能否勝出?

時間會告訴我們答案。

參考鏈接:

?https://arxiv.org/pdf/2206.07682.pdf

?https://openai.com/product/gpt-4

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

文心一言發(fā)布:GPT-4的「搶跑」與中國版ChatGPT的「長跑」

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說