0
當(dāng)科技的腳步踏入人工智能時代,一項技術(shù)創(chuàng)新帶來的變革能夠深入千行百業(yè),離不開其底層的通用性、能實現(xiàn)自動化生產(chǎn)的能力。過去半年中,由 ChatGPT、GPT-4 等為代表掀起的浪潮中,大模型在解決多項任務(wù)中的通用能力,讓人們看到了智能時代 AI 大規(guī)模落地的可行性。
據(jù)不完全統(tǒng)計,當(dāng)前國內(nèi)已發(fā)布超過 80個大模型產(chǎn)品,對應(yīng)不同行業(yè)、不同應(yīng)用場景,各個大廠和研究機(jī)構(gòu)紛紛加入資源競賽的大模型游戲,“百模大戰(zhàn)”正如火如荼地進(jìn)行。
而現(xiàn)實的情況是,訓(xùn)練成本高的基礎(chǔ)大模型在滿足細(xì)分場景下的特定需求上正顯示出“牛刀小用”的短板,同時,在專業(yè)領(lǐng)域問題的表現(xiàn)上、甚至?xí)霈F(xiàn)模型“一本正經(jīng)地胡說八道”的幻覺。有業(yè)內(nèi)人士就指出,ChatGPT 給出的結(jié)果正確與否、需要交由專業(yè)的人去判斷。
業(yè)界對大模型的應(yīng)用需求井噴,但面對基礎(chǔ)大模型在生產(chǎn)環(huán)節(jié)的準(zhǔn)確率相對較低、能力表現(xiàn)不匹配等情況,為 AI 的“iPhone 時刻”而沸騰的從業(yè)者們也不得不被迫“降溫”。
在大模型落地的討論中,幾個重要的問題亟需獲得解答:AI 的通用性是否被高估?什么樣的大模型,才能稱得上智能生產(chǎn)力?行業(yè)需要怎樣的大模型和服務(wù)?
下一輪競賽的決勝手
2002 年諾貝爾經(jīng)濟(jì)學(xué)獎得主 Daniel Kahneman 在其書《Thinking Fast And Slow》中,提出人類的兩種思考模式,第一種是以直覺判斷為主的“快思考”,第二種是“慢思考”,需要進(jìn)行大量的推理和計算。
大模型與以往人工智能技術(shù)的不同之處,就在于它采用了第二種“慢思考”的模式,在與人類的交互中不斷學(xué)習(xí),進(jìn)而獲得更好解決問題的能力。
由此,過去四個多月里,國內(nèi)也出現(xiàn)了一批追趕 ChatGPT 熱潮的對話交互類大模型,以滿足 C 端用戶娛樂、創(chuàng)作等基礎(chǔ)需求,應(yīng)用在如聊天、語句優(yōu)化、文案創(chuàng)作等通識屬性較強(qiáng)的場景上。
當(dāng)我們將大模型能力遷移到需求更大的產(chǎn)業(yè)領(lǐng)域中,不可避免地會遇到更低頻、長尾的復(fù)雜場景和大規(guī)模協(xié)同的需求。這些場景由于樣本少、數(shù)據(jù)分布不均,也意味著在相應(yīng)的研發(fā)上要支付更高昂的成本,通用大模型的優(yōu)勢由此顯現(xiàn)。
然而事實上,盡管大模型落地的呼聲高漲,但在解決專業(yè)知識領(lǐng)域的問題表現(xiàn)上仍有不足之處,關(guān)于 AI 通用能力是否被高估的討論重回焦點。
一位從事數(shù)據(jù)結(jié)構(gòu)化模型研發(fā)負(fù)責(zé)人告訴AI 科技評論,具備知識圖譜、能對行業(yè)知識和數(shù)據(jù)進(jìn)行提煉的小模型,在專業(yè)領(lǐng)域中的能力一定會超過大模型。
以銀行場景中的基金對賬單托管業(yè)務(wù)為例,通用大模型可以對結(jié)構(gòu)化信息進(jìn)行提取和一定的推理,但由于市場中基金公司眾多,往往每家公司的賬單樣式都不相同,加之復(fù)雜的表格和圖文呈現(xiàn)方式,因此,模型的通用能力在解決特定信息、非結(jié)構(gòu)化數(shù)據(jù)的抽取需求上,效果也會大打折扣。
再比如煤礦開采流程,煤礦井下重視生產(chǎn)安全,不便于異常樣本的人工制造 ,只能在過往案例中去學(xué)習(xí),因此也就存在不夠精準(zhǔn)的問題。專業(yè)人士指出,“大模型在專業(yè)知識領(lǐng)域大概只能做到百分之六七十的準(zhǔn)確率,外行人看著可能覺得效果不錯,但在內(nèi)行人看來是無法使用的?!?/p>
在行業(yè)生產(chǎn)環(huán)節(jié)中,95% 是一個標(biāo)準(zhǔn),企業(yè)對模型容忍度低、精度和效率要求更高,通用大模型的局限性問題愈加顯現(xiàn)。
這決定了行業(yè) Know-How 在生成內(nèi)容中所起到的關(guān)鍵性作用。
人類從生活和工作中積累經(jīng)驗、凝結(jié)出智慧,將行業(yè)領(lǐng)域知識注入模型當(dāng)中,提升模型對知識的記憶和推理能力,可以有效填補(bǔ)基礎(chǔ)模型和場景之間的認(rèn)知鴻溝。
“知識增強(qiáng)型”行業(yè)大模型已成為產(chǎn)業(yè)共識,是更接近人類大腦、釋放智能生產(chǎn)力的 AI 落地范式。
中國工程院院士鄔賀銓也表示,Chat類的大模型引發(fā)新一輪熱潮,但對話、寫詩、作畫絕不是大模型的全部?!拔覀冃枰ド钊胨伎即竽P偷膽?yīng)用方向,要將大模型切實投入到城市發(fā)展、金融科技、生物醫(yī)藥、工業(yè)制造、科學(xué)研究等領(lǐng)域,也需要專業(yè)的企業(yè)和組織加速其在實體產(chǎn)業(yè)落地,為產(chǎn)業(yè)剛需帶來實實在在的大價值,去真正意義大規(guī)模服務(wù)社會?!?/p>
一個形象的比喻是,通用大模型更像大學(xué),但它不會統(tǒng)治一切,行業(yè)大模型是不同科目培養(yǎng)出來的千千萬萬個大學(xué)生,它們所做的事情是怎么“學(xué)以致用”,與實體產(chǎn)業(yè)深度融合。
也即是說,行業(yè)大模型是構(gòu)建在基礎(chǔ)大模型的能力之上,具備一定的通用能力、能覆蓋多任務(wù)使用場景,還結(jié)合了行業(yè) Know- How 或引入知識圖譜、有解決專業(yè)領(lǐng)域問題能力。
正如上述銀行場景,一個理想的設(shè)想是,不具備模型構(gòu)建能力的企業(yè)既能以調(diào)用通用大模型對話、生成等全部能力,也可以結(jié)合自身需求和特定場景,將有 OCR 專業(yè)知識和數(shù)據(jù)的產(chǎn)品應(yīng)用在解決智能文檔識別與處理的各類垂直難題上。
目前,業(yè)內(nèi)一個普遍的看法是,未來業(yè)內(nèi)只會有兩三家大模型獨大,與產(chǎn)業(yè)更近的行業(yè)大模型才是主流方向。行業(yè)人士預(yù)測,接下來幾個月內(nèi),行業(yè)大模型也將迎來一波密集的發(fā)布熱潮。
據(jù)陸奇在 6 月奇績創(chuàng)壇春季創(chuàng)業(yè)路演上分享的項目數(shù)據(jù)顯示,創(chuàng)業(yè)營最終錄取的 60 個項目中,大模型項目共 39 個,占比高達(dá) 65%,絕大部分都是圍繞行業(yè)大模型應(yīng)用展開。
可以看到,行業(yè)大模型的故事才剛剛開始,但各路玩家們已經(jīng)對其寄予了不小的期待。
向行業(yè)更深處
據(jù) 2022 年工信部發(fā)布的《國家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)“智賦百景”》通知顯示,在公共安全、交通運(yùn)輸?shù)染糯?AI 落地領(lǐng)域中,制造、農(nóng)業(yè)、能源、金融、醫(yī)療作為我國重要經(jīng)濟(jì)支柱,雖然貢獻(xiàn)多、但尚屬于 AI 落地未開發(fā)領(lǐng)域,場景滲透率較低。
例如在鐵路領(lǐng)域中,當(dāng)前,我國鐵路營業(yè)里程 15.5 萬公里,鐵路貨車超過 100 萬輛,為了保障貨車運(yùn)行的安全性,貨車運(yùn)行故障動態(tài)圖像檢測系統(tǒng)(TFDS、Trouble of moving Freight car Detection System)被廣泛應(yīng)用。但受制于技術(shù)發(fā)展,TFDS 仍采用人工方式進(jìn)行故障識別。
假設(shè)貨運(yùn)列車通常編組為 60-100 輛一組,每套 TFDS 對應(yīng) 5 個拍攝點位,每輛車/每節(jié)車廂拍攝約 80 張圖片。以平均每列車 50 輛車廂計算,每列車拍攝圖片就多達(dá) 4000 張,并且需要檢測人員在 10 分鐘左右時間看完,不僅人力成本高,人力勞動強(qiáng)度也很大,這種重復(fù)性、高強(qiáng)度的判斷工作極其導(dǎo)致疲勞監(jiān)測情況的發(fā)生,進(jìn)而導(dǎo)致誤判。
大模型的產(chǎn)業(yè)化尚任重道遠(yuǎn),但行業(yè)對落地的訴求已十分迫切。
華為云人工智能領(lǐng)域首席科學(xué)家田奇在4月高峰論壇上作《AI for Industries,賦能千行百業(yè)智能升級》演講
中國工程院院士李伯虎近日也明確指出,制造業(yè)是國民經(jīng)濟(jì)的主體,特別期望AI大模型能加強(qiáng)制造業(yè)“技術(shù)、產(chǎn)業(yè)、應(yīng)用”的進(jìn)一步融合,研發(fā)面向制造業(yè)的AI大模型技術(shù),為我國制造業(yè)的數(shù)字化轉(zhuǎn)型與智能化升級,進(jìn)而為實現(xiàn)我國邁入制造強(qiáng)國的偉大戰(zhàn)略目標(biāo)做出新的重大貢獻(xiàn)。
在這一背景下,自帶場景、數(shù)據(jù)和用戶的行業(yè)、產(chǎn)業(yè)客戶成為了大模型公司相互爭奪的資源,而對深入實體產(chǎn)業(yè)當(dāng)中的企業(yè)來說,選擇與具有自研能力的廠商合作,也省去了他們大量研發(fā)模型的資源和時間成本。
目前,面向大模型的行業(yè)和產(chǎn)業(yè)客戶,市場上所提供的合作方案主要有以下幾類:一是提供算力服務(wù);二是提供通用大模型的底層設(shè)施,企業(yè)可以在平臺上使用自己的垂類數(shù)據(jù)訓(xùn)練行業(yè)大模型;三是定制化服務(wù)的行業(yè)大模型;此外還有其他的配套服務(wù),如云計算、AI 框架等。
總體來說,就是從最底層的算力存儲和網(wǎng)絡(luò)、到上層的機(jī)器學(xué)習(xí)平臺、再到配套模型與服務(wù),將每一個需求和反饋都順暢地傳遞到大模型技術(shù)及應(yīng)用的每個環(huán)節(jié),提供一套完整的解決方案。
而站在企業(yè)的視角上,能夠深入行業(yè)、進(jìn)入生產(chǎn)環(huán)節(jié)的大模型還需要考慮兩個問題。首先是私有數(shù)據(jù)的安全問題,行業(yè)大模型想要效果表現(xiàn)好,離不開企業(yè)提供足量、質(zhì)量夠高的數(shù)據(jù)來支撐模型訓(xùn)練要求,這也是為什么多數(shù)企業(yè)通常選擇私有化部署的原因;第二則是成本可控,企業(yè)購買大模型服務(wù)遠(yuǎn)不止模型前期的訓(xùn)練和微調(diào)成本,還包括了框架、算力等整套服務(wù)以及后期運(yùn)維等。
如今,市面上大模型產(chǎn)品眾多,企業(yè)也亟需從大模型的商業(yè)化狂潮中回歸冷靜,用性價比最優(yōu)的方式選擇最佳的合作對象。
華為云盤古大模型將至
能否帶來新驚喜?
7 月 7 日,華為開發(fā)者大會2023(Cloud)將在東莞拉開帷幕。據(jù)此前公布的主題演講議程來看,華為云盤古大模型將迎來重大升級,明確定位“為行業(yè)而生”;其中,華為常務(wù)董事、華為云 CEO 張平安就“一切皆服務(wù),AI重塑千行百業(yè)”進(jìn)行主題演講,華為云人工智能領(lǐng)域首席科學(xué)家田奇、華為諾亞方舟實驗室主任姚駿也將首次揭秘盤古基礎(chǔ)大模型的全棧創(chuàng)新、以及行業(yè)大模型的“煉成術(shù)”。
自四五月份以來,各大廠商和創(chuàng)業(yè)公司的大模型層出不窮,相較之下,華為卻顯得頗為低調(diào),對外幾乎沒有透露任何關(guān)于盤古大模型升級的消息。在 4 月人工智能大模型技術(shù)高峰論壇(下稱“高峰論壇”)上,田奇現(xiàn)身會場,對備受矚目的類 GPT 模型未提及過多細(xì)節(jié),更多聚焦在大模型的應(yīng)用范例介紹,這也令外界頗感不及預(yù)期。
華為入場越晚,用戶審視的目光也會越挑剔。但當(dāng)我們開始探究華為“姍姍來遲”背后的原因時卻發(fā)現(xiàn),華為在大模型的探索并非剛剛開始,相反,早于 ChatGPT 和大模型火起來之前,華為已經(jīng)組建起以田奇為核心的大模型人才團(tuán)隊。
2020 年 9 月,盤古大模型立項,彼時確定了三個核心設(shè)計原則:一是模型要大、能吸收海量數(shù)據(jù),二是網(wǎng)絡(luò)結(jié)構(gòu)要強(qiáng)、從而真正發(fā)揮出模型的性能,三是要具備優(yōu)秀的泛化能力、能落地到各行各業(yè)的工作場景中。
到了 2021 年 4 月,在華為云盤古視覺(CV)大模型對外公布的同一時間,結(jié)合行業(yè)數(shù)據(jù)打造系列 CV 行業(yè)大模型已經(jīng)實現(xiàn)了在醫(yī)療影像檢測、工業(yè)缺陷檢測和遙感影像分析等多場景中應(yīng)用,通過模型蒸餾、抽取實現(xiàn)行業(yè)場景的適配。
可以說,華為是國內(nèi)最早加入大模型競賽、并已經(jīng)將行業(yè)大模型落地的廠商之一。
據(jù)田奇在高峰論壇的演講中提到,華為云將盤古大模型分為了三級:
L0,基礎(chǔ)模型,例如GPT-3、GPT-4等這類無法直接應(yīng)用,需要同相應(yīng)的行業(yè)和場景數(shù)據(jù)結(jié)合訓(xùn)練的行業(yè)大模型
L1,行業(yè)模型,這類模型可直接在具體細(xì)分場景中進(jìn)行部署
L2,細(xì)分場景模型
田奇表示,如何從行業(yè)大模型 L1 中快速生產(chǎn)高質(zhì)量的部署模型(細(xì)分場景模型)L2 并部署到端、邊、云側(cè)就成了一個重要課題。
MaaS(模型即服務(wù))時代,傳統(tǒng)產(chǎn)業(yè)和企業(yè)在大模型的沖擊下正迎來變革性的升級再造,“云智一體”成為共識,集齊資金、人才、數(shù)據(jù)等優(yōu)勢,向上對接研發(fā)和算法工程師、個人開發(fā)者等,向下為底層軟硬件廠商提供服務(wù)。
對華為云來說,這也意味著,基于 AI 與云的深度融合,云服務(wù)為盤古大模型提供計算資源,企業(yè)客戶也有了更多 AI 大模型和集成服務(wù)的選擇,甚至是自上而下全套的 AI 解決方案。
此外,大模型要走向工業(yè)大生產(chǎn),AI 芯片、框架、機(jī)器學(xué)習(xí)平臺以及數(shù)據(jù)、應(yīng)用等等,都缺一不可。
2022 年 8 月,美國政府簽署《2022年芯片和科學(xué)法案》,在半導(dǎo)體領(lǐng)域?qū)χ袊l(fā)起的限制日漸升級;而伴隨著大模型推升了對算力的狂熱需求,公開數(shù)據(jù)顯示,近 5 個月以來,英偉達(dá)芯片價格累計漲幅已高達(dá) 37.5%, GPU 交貨周期也被拉長,需要3個月甚至更長時間。對此,華為在近日也宣布,將于7月份發(fā)布面向 AI 大模型的新款存儲產(chǎn)品。
經(jīng)過多年的發(fā)展,華為已積累了大模型走向行業(yè)落地的全棧技術(shù),包括 AI 芯片、AI 框架Mindspore、以及全流程支持 MLOps 的 AI 平臺 ModelArts 等,一應(yīng)具全。
同時,華為也積累了豐富的大模型行業(yè)實踐。例如,在復(fù)雜、危險性較高的煤礦生產(chǎn)工作中,華為云去年推出了盤古礦山大模型,只需導(dǎo)入海量無標(biāo)注的礦山場景數(shù)據(jù),即可進(jìn)行無監(jiān)督自主學(xué)習(xí),僅一個大模型就能覆蓋煤礦的采、掘、機(jī)、運(yùn)、通等業(yè)務(wù)流程下的 1000 多個細(xì)分場景。
煤礦行業(yè)中存在著場景需求多、礦山間復(fù)制難、場景落地難、AI人才不足等挑戰(zhàn),目前 300 米井下仍需大量人員現(xiàn)場作業(yè),面對這一緊迫的需求,如何用 AI 實現(xiàn)“少人無人”的安全高效作業(yè)成為煤礦智能化追求的重要目標(biāo)。
例如,主運(yùn)系統(tǒng)是煤礦生產(chǎn)的生命線,一旦發(fā)生故障,將直接導(dǎo)致停工停產(chǎn),每天減產(chǎn)幾萬噸。過去,主運(yùn)系統(tǒng)十分依賴人工巡檢,礦工需要每天走 10 到 20 公里巡檢,皮帶距離長,周圍環(huán)境也很惡劣,工作量極大。
但在引入盤古礦山大模型后,AI 代替人成為了主運(yùn)智能監(jiān)測系統(tǒng)的眼睛,能夠精準(zhǔn)識別大塊煤、錨桿等異常情況,異物識別準(zhǔn)確率達(dá)98%;同時,全時段的巡檢也能進(jìn)一步幫助工作人員及時地發(fā)現(xiàn)問題,避免因漏檢造成的安全事故,縮短停機(jī)時間,同時提升井下巡檢人員的工作效率。
此外,在掘進(jìn)場景中,基于盤古礦山大模型的掘進(jìn)作業(yè)序列智能監(jiān)測可用于替代不確定的人工流程,動作規(guī)范識別準(zhǔn)確率超過95%,以保障井下作業(yè)安全。
可以看到,華為的行業(yè)大模型已經(jīng)勾勒出未來工業(yè)化智能生產(chǎn)時代的雛形,在水面之下,是基于大模型底層技術(shù)體系、深入行業(yè)領(lǐng)域知識向更多產(chǎn)業(yè)層面的延伸和探索。
那么,在這次華為開發(fā)者大會上,華為云能帶來哪些盤古大模型的新升級,值得期待。
基于新的技術(shù)底座,在國際人工智能競爭愈發(fā)激烈的當(dāng)下,大模型浪潮帶動產(chǎn)品、服務(wù)、行業(yè)等多方位變革已是不爭的事實。接下來的競賽,不再是局限于大模型技術(shù)的追逐,在 AI 深入產(chǎn)業(yè)的視野中,千行百業(yè)也正迎來巨大的想象空間。
(雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。