0
如何抓住 AI 的機(jī)會(huì)?
這是進(jìn)入大模型時(shí)代后,面對(duì)新的起點(diǎn),各大云廠商在不斷思考的問題。
毋庸置疑,AI 與云已經(jīng)成為緊密的拍檔。大模型的迭代進(jìn)化離不開云計(jì)算的支撐,而大模型的落地應(yīng)用,給云計(jì)算勾勒了一個(gè)比移動(dòng)互聯(lián)網(wǎng)更具想象力的新世界。新一輪的云計(jì)算周期已然開始了。
在海外,老牌巨頭微軟憑借 AI 在一年多內(nèi)搖身變成了最潮科技公司;在國內(nèi),阿里云走在最前列,是唯一兼具強(qiáng)大模型和完備云平臺(tái)的大廠,而且還選擇了開源。
事實(shí)上,阿里云早在 2019 年便投入大模型研發(fā),2022 年喊出MaaS(模型即服務(wù))第一聲,此后又從底層算力(IaaS)到 AI 平臺(tái)(PaaS)再到模型服務(wù)(MaaS)全棧重構(gòu),走出了一條云+ AI 的獨(dú)特路徑。從模型到平臺(tái)到算力底座全方位投入,選擇“既要、又要、還要”,阿里云幾乎是唯一的樣本。
那么,阿里云的“云+ AI ”啟示錄能成為 AI 時(shí)代云廠商變革的新范本嗎?
5 月 9 日,阿里云在北京舉辦 AI 智領(lǐng)者峰會(huì),此時(shí)距離通義大模型問世正好一周年。阿里云首席技術(shù)官周靖人作了全面總結(jié),關(guān)于大模型能力,關(guān)于模型落地,關(guān)于開源與生態(tài)。
01從追趕到并行,技術(shù)永遠(yuǎn)是硬實(shí)力
距離ChatGPT 引爆新一輪 AI 浪潮已經(jīng)一年多,在這段一路狂奔、野蠻生長的日子里,大模型軍備競(jìng)賽的風(fēng)從沒停過,從架構(gòu)到參數(shù),從單一語言大模型到多模態(tài)大模型,從基礎(chǔ)大模型到行業(yè)大模型……
“卷生卷死”的百模大戰(zhàn)帶來的啟示是,夯實(shí)基礎(chǔ)模型的能力,永遠(yuǎn)是發(fā)展的硬道理,技術(shù)就是硬實(shí)力。
憑借技術(shù)實(shí)力在云計(jì)算時(shí)代叱咤風(fēng)云的阿里云,自然懂得大模型能力的重要性,這是它想要走好“云+AI”的技術(shù)路徑的關(guān)鍵一步。
結(jié)合通義大模型的迭代升級(jí)速度來看,阿里云在推進(jìn)模型能力上的步伐很是穩(wěn)健。
去年 4 月,通義大模型問世,緊接著阿里云持續(xù)聚焦基礎(chǔ)模型的技術(shù)研發(fā),綜合性能超越 GPT-3.5 的通義千問 2.0、通義千問 2.1 相繼推出。
如今,在距離通義大模型問世一周年之際,阿里云又帶來了最新升級(jí)的通義大模型。
5 月 9 日,阿里云首席技術(shù)官周靖人宣布通義千問 2.5 正式發(fā)布,模型能力再次迎來新突破。
據(jù)介紹,相較于通義千問 2.1 版本,通義千問 2.5 的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。
此外,與 GPT-4 相比,中文語境下,通義千問 2.5 文本理解、文本生成、知識(shí)問答及生活建議、閑聊及對(duì)話、安全風(fēng)險(xiǎn)等多項(xiàng)能力趕超 GPT-4!
而在權(quán)威基準(zhǔn) OpenCompass 上,通義千問 2.5 得分追平 GPT-4 Turbo——這也是國產(chǎn)大模型首次在該基準(zhǔn)取得如此成績(jī),可謂是“地表最強(qiáng)中文大模型”。
同時(shí),通義還發(fā)布了最新款的開源模型——1100 億參數(shù)的 Qwen1.5-110B,超越 Meta 的 Llama-3-70B 模型,成為“開源領(lǐng)域最強(qiáng)大模型”。
不僅是語言大模型,在多模態(tài)大模型、行業(yè)大模型上,阿里云也在持續(xù)發(fā)力。通義千問視覺理解模型 、通義千問代碼大模型等分別在各大基準(zhǔn)榜單上名列前茅。
但單一的榜單數(shù)據(jù)并不能說明一切,來自用戶的使用感受似乎更能說明模型的真實(shí)水準(zhǔn)。
據(jù)統(tǒng)計(jì),如今通義大模型的日調(diào)用量早已過億,通過阿里云服務(wù)的企業(yè)超 9 萬、通過釘釘服務(wù)的企業(yè)則超過 220 萬,通義開源模型累計(jì)下載量突破 700 萬,成為中國企業(yè)最受歡迎的大模型。
雖然已經(jīng)在模型能力上已經(jīng)實(shí)現(xiàn)了從最初的追趕到并行,但對(duì)于阿里云來說,這還不夠。
正如周靖人所言,當(dāng)前大模型有那么多家,大家說的都是同樣的故事,但最后比拼的其實(shí)是能力差異,以及接下來的如何融合生態(tài)(尤其是開發(fā)者的生態(tài))、如何落地運(yùn)用起來,這才是最大的差異。
基于阿里云在大模型能力上的積累,讓企業(yè)和開發(fā)者將模型“玩轉(zhuǎn)”起來,是阿里云要思考的第二個(gè)問題。
02全面升級(jí)百煉平臺(tái),加速大模型落地應(yīng)用
從去年下半年開始,大模型的戰(zhàn)事信號(hào)已經(jīng)開始從“做大模型”向“用大模型”轉(zhuǎn)變。2024 年,商業(yè)化、落地應(yīng)用成為大模型公司的主旋律。
最新的《中國大模型中標(biāo)項(xiàng)目監(jiān)測(cè)報(bào)告》顯示,今年 1-4 月,可統(tǒng)計(jì)到的大模型相關(guān)中標(biāo)金額已達(dá)到 2023 年全年披露金額的 77% 左右,涉及政務(wù)、金融、運(yùn)營商、能源、教科、交通等各行各業(yè),表明企業(yè)對(duì)大模型的應(yīng)用需求正快速增長。
但,大模型的落地,并不是通過卷算力、卷參數(shù)的“暴力革命”就能實(shí)現(xiàn),中間需要一個(gè)漫長的過程。
因?yàn)閷?duì)于基礎(chǔ)大模型來說,它所具備的更多是通用知識(shí),但在具體落地過程中,大模型面對(duì)的是各種各樣的垂直業(yè)務(wù)場(chǎng)景,而千行百業(yè)中的每一個(gè)企業(yè)都有自己明確、特殊的需求。
如果無法解決這些問題,大模型的落地并非易事。周靖人告訴雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)),在與大部分企業(yè)接觸過程中接收的需求反饋,讓阿里云意識(shí)到,“如果不對(duì)基礎(chǔ)模型進(jìn)行修整,難以直接對(duì)接業(yè)務(wù)需求?!?/p>
基于此,阿里云給出的解法是為用戶和開發(fā)者提供一個(gè)工具平臺(tái)——一站式大模型和應(yīng)用開發(fā)平臺(tái),簡(jiǎn)化用戶在部署大模型時(shí)所需進(jìn)行的底層算力部署、模型預(yù)訓(xùn)練、工具開發(fā)等復(fù)雜工作。
去年 10 月,百煉大模型平臺(tái)正式推出,這意味著開發(fā)者僅通過“拖拉拽” ,5 分鐘即可開發(fā)出一款大模型應(yīng)用,幾小時(shí)“煉”出一個(gè)專屬模型,大大降低開發(fā)門檻。
如今半年多過去,此次 AI 峰會(huì)上,阿里云宣布對(duì)百煉平臺(tái)進(jìn)行全面升級(jí),從模型開發(fā)、應(yīng)用開發(fā)到算力底座,變得更加易用、開放。
另外,還引入了更多模型,同時(shí)率先兼容 LlamaIndex 等開源框架,企業(yè)可自由替換能力組件來適配自身系統(tǒng)。
針對(duì)當(dāng)下企業(yè)最關(guān)注的 RAG 鏈路,百煉提供靈活開放的企業(yè)級(jí)檢索增強(qiáng)服務(wù),“5 到 10 行代碼”即可搭建 RAG 應(yīng)用,讓大模型擁有“最強(qiáng)外掛”。
具體來看,針對(duì)企業(yè)應(yīng)用大模型的三種范式,百煉提供了豐富的模型和易用的工具箱。
一是對(duì)于那些希望直接“開箱即用”的企業(yè),百煉集成了上百款大模型 API,除了通義、Llama、ChatGLM 等系列,還首家托管百川等系列三方模型,覆蓋國內(nèi)外主流廠商,同時(shí)支持企業(yè)上架通用或行業(yè)模型,提供足夠多的模型選擇。
二是對(duì)于那些需要對(duì)大模型進(jìn)一步微調(diào)的用戶,百煉提供從數(shù)據(jù)管理、模型調(diào)優(yōu)、評(píng)測(cè)到部署的全鏈路模型服務(wù),用戶可彈性按需調(diào)用算力,無需關(guān)心底層架構(gòu)。訓(xùn)練過程可視化,還可自動(dòng)評(píng)測(cè)模型質(zhì)量,并與其他模型對(duì)比。
三是對(duì)于那些希望打造 RAG 等應(yīng)用的企業(yè),百煉支持 Assistant API 開發(fā)模式,可在百煉上輕松創(chuàng)建知識(shí)庫,并一鍵開啟知識(shí)檢索增強(qiáng)(RAG)。
據(jù)悉,目前,一汽、微博、小米、完美世界、朗新集團(tuán)、央視網(wǎng)等企業(yè)都已經(jīng)應(yīng)用上百煉平臺(tái)。
03打造開源模型+開放的云生態(tài)
技術(shù)要有好的發(fā)展一定要有生態(tài),而不是閉門造車。阿里云早就意識(shí)到了這一點(diǎn)——阿里云是全球唯一一家積極做最先進(jìn)的 AI 模型同時(shí),也敢于全方位開源的云計(jì)算廠商。
阿里云想要打造一朵AI時(shí)代最開放的云。
其實(shí),開源VS閉源,一直是大模型廠商所面臨的艱難抉擇。
堅(jiān)定閉源路線的企業(yè)認(rèn)為,閉源能夠維持技術(shù)上的護(hù)城河,是更符合實(shí)際的理想商業(yè)模式。而堅(jiān)持開源路線的企業(yè)則認(rèn)為,眾人拾柴火焰高。
此前,IDC 的一項(xiàng)調(diào)研數(shù)據(jù)顯示,在實(shí)際應(yīng)用開發(fā)過程中,企業(yè)采用開源模型與商業(yè)化模型的比例為 51% 與 49%。
而周靖人認(rèn)為,開源,對(duì)整個(gè)技術(shù)領(lǐng)域的貢獻(xiàn)毋庸置疑。開源模型給了企業(yè)和開發(fā)者更多選擇,大家不用擔(dān)心被綁定在某一家的產(chǎn)品或技術(shù)線上,同時(shí)也可以最大程度地自由使用不同模型進(jìn)行應(yīng)用創(chuàng)新。
“無論是 PC 端還是手機(jī)端,要能夠與各種各樣的場(chǎng)景做適配,快速搭建起更加復(fù)雜的業(yè)務(wù)、AI 系統(tǒng),其實(shí)這都需要一個(gè)開放開源的生態(tài),這也是全球開發(fā)者和企業(yè)在毫無疑問地?fù)肀А_源’體系的原因。”周靖人說道。
因此,去年 8 月通義宣布加入開源行列后,便一直堅(jiān)定開源路線,沿著“全模態(tài)、全尺寸”開源路線陸續(xù)推出十多款模型。
據(jù)雷峰網(wǎng)了解,目前通義已經(jīng)開源了 8 款參數(shù)規(guī)模從 5 億到 1100 億的大語言模型。
開源的本質(zhì)是交流,歷史上多種技術(shù)的突破都證明了這一路徑對(duì)更大圖景的推動(dòng)作用。打通接口、拉平認(rèn)知,釋放大模型能力,將對(duì)整個(gè)中國 AI 發(fā)展都起到積極作用。
正是早早意識(shí)到這一點(diǎn),所以阿里云在 2022 年的云棲大會(huì)上宣布搭建魔搭(ModelScope)社區(qū),這也是國內(nèi)首個(gè) AI 模型開源社區(qū)。
據(jù)雷峰網(wǎng)了解,魔搭社區(qū)彼時(shí)一經(jīng)推出,便將阿里近五年苦心研發(fā)的 300 多個(gè)優(yōu)質(zhì)模型全部開源,促進(jìn)中國的 AI 基礎(chǔ)研究。
而目前,據(jù)周靖人介紹,魔搭社區(qū)平臺(tái)還在擴(kuò)大建設(shè),平臺(tái)上的高質(zhì)量開源模型總數(shù)已超過 4500 個(gè),開發(fā)者數(shù)量超過 500 萬,已成長為“中國最大的AI模型社區(qū)”。
周靖人堅(jiān)信,大模型還有很大一部分潛力沒有真正被挖掘出來,當(dāng)有越來越多的開發(fā)者、企業(yè)能結(jié)合自己的需求,來促進(jìn)大模型的發(fā)展和應(yīng)用,將帶來翻天覆地的變化。在當(dāng)下這個(gè)時(shí)間點(diǎn),阿里云希望以開放的心態(tài)把最先進(jìn)的技術(shù)開源出來,大家做并行探索。
“這很重要,能對(duì)大到每個(gè)產(chǎn)業(yè),小到每個(gè)企業(yè)的創(chuàng)新性開發(fā)起到促進(jìn)作用?!?/p>
04寫在最后
大會(huì)現(xiàn)場(chǎng),當(dāng)被問到,曾經(jīng)在云計(jì)算時(shí)代擁有絕對(duì)領(lǐng)先地位的阿里云(中國第一、亞太第一),如何在 AI 時(shí)代繼續(xù)保持領(lǐng)先時(shí),周靖人沉思了一下,回答道,早在大模型浪潮到來之前,阿里云就已預(yù)判業(yè)界發(fā)展趨勢(shì),率先提出 MaaS 理念,布局未來。
2022 年 11 月初,ChatGPT還未問世,在云棲大會(huì)上,作為阿里云大模型研發(fā)負(fù)責(zé)人的周靖人即提出 MaaS (模型即服務(wù))——把模型作為重要的生產(chǎn)元素,圍繞模型的生命周期設(shè)計(jì)產(chǎn)品和技術(shù),包括數(shù)據(jù)處理、特征工程、模型的訓(xùn)練和調(diào)優(yōu)、模型的服務(wù)等。
這是一條從未被提及的新概念。
后來的事情大家都知道了,當(dāng) 2023 年年初 ChatGPT 拉下 AI 新時(shí)代的序幕,大模型進(jìn)入“百模大戰(zhàn)”階段,MaaS 這一理念被廣泛提及、驗(yàn)證,并逐漸被亞馬遜、微軟以及騰訊、百度等國內(nèi)外云廠商所沿用,將其作為自己在新時(shí)代 AI 技術(shù)變革中轉(zhuǎn)型的新選擇,MaaS 成為最有望改變?cè)茝S商商業(yè)模式的路徑。
如今,距離阿里云提出 MaaS 已有一年多,根據(jù)所交出的答卷,可以拼出,在 AI 時(shí)代,阿里云基于 MaaS 做出的完整戰(zhàn)略布局。
模型層面,聚焦通義大模型的技術(shù)研發(fā),將最好的大模型提供給客戶;模型服務(wù)層,以百煉大模型平臺(tái)為主要界面,針對(duì)企業(yè)應(yīng)用大模型時(shí)的需求,提供模型調(diào)用、微調(diào)、訓(xùn)練、開發(fā)專屬大模型及應(yīng)用的工具服務(wù);AI 基礎(chǔ)設(shè)施層,依靠云計(jì)算體系,為其他大模型公司提供算力平臺(tái);生態(tài)層,持續(xù)構(gòu)建開源開放的開發(fā)者生態(tài),推動(dòng)整個(gè)行業(yè)的發(fā)展。
以模型為中心,全面重構(gòu)自身技術(shù)架構(gòu);同時(shí),作為平臺(tái),為中國企業(yè)、開發(fā)者以及大模型生態(tài)中的公司提供模型相關(guān)的各類服務(wù),最終推動(dòng)整個(gè)產(chǎn)業(yè)的共同發(fā)展。
這就是阿里云想要在 AI 時(shí)代講述的MaaS新敘事。
“只有這樣,在 AI 時(shí)代,阿里云才能仍然是 No.1,仍然能為各行各業(yè)提供最先進(jìn)的技術(shù)、最廣泛的產(chǎn)業(yè)應(yīng)用?!?/p>
AI 時(shí)代,阿里云將如何保持行業(yè)的引領(lǐng)者定位,拭目以待。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。