0
本文作者: 貝爽 | 2021-09-26 16:55 |
悟道2.0,要怎么用起來?
連創(chuàng)“中國首個”和“世界最大”兩項記錄后,悟道大模型的落地應(yīng)用成為業(yè)界關(guān)心的熱點話題。
GPT-3的問世掀起了一股“煉大模型”的浪潮,去年10月,北京智源研究院集結(jié)中國產(chǎn)學(xué)界100多位AI專家聯(lián)合攻關(guān),在一年之內(nèi)發(fā)布了1.75萬億級大規(guī)模預(yù)訓(xùn)練模型悟道2.0,超越GPT-3、Switch Transformer,成為全球最大萬億級人工智能大模型。
時至今日,“產(chǎn)業(yè)應(yīng)用”成為未來人工智能大模型時代的下一個賽點。
GPT-3早早開放了API供開發(fā)者使用。據(jù)OpenAI透露,截止今年3月,全球已有300多個APP采用了GPT-3技術(shù),基于GPT-3的應(yīng)用也有100多個;今年悟道2.0發(fā)布會上,智源研究院啟動大模型產(chǎn)業(yè)生態(tài)建設(shè)規(guī)劃,表示悟道大模型下一步將作為AI基礎(chǔ)設(shè)施,像“發(fā)電廠”一樣為不同行業(yè)、企業(yè)、個人開發(fā)者賦能。
9月24日,智源研究院承辦2021中關(guān)村論壇“人工智能與多學(xué)科協(xié)同創(chuàng)新”平行論壇,圍繞“人工智能大模型時代學(xué)科交叉和可持續(xù)發(fā)展”展開深入交流。會上,智源研究院學(xué)術(shù)副院長、清華大學(xué)教授唐杰公布了悟道2.0產(chǎn)業(yè)應(yīng)用的最新進展,并發(fā)布了一系列技術(shù)創(chuàng)新成果。
唐杰教授表示,悟道大模型應(yīng)用技術(shù)正在像“低門檻+高效率+高情商”三個方向努力,能夠滿足不同行業(yè)和企業(yè)實現(xiàn)規(guī)?;?、產(chǎn)業(yè)化的應(yīng)用需求,悟道正在從最大向“更好用”邁進。
此次技術(shù)創(chuàng)新包括:“悟道”大模型開發(fā)平臺、大模型高效推理工具包BMInf、全新升級的AI文圖繪畫大師CogView和實現(xiàn)大模型群聊的對話模型EVA。
大會現(xiàn)場還發(fā)布了“悟道2.0”賦能產(chǎn)業(yè)應(yīng)用案例:冬奧會語音播報數(shù)字人和OPPP小布助手問答系統(tǒng)。小布助手是OPPO旗下開放式對話虛擬語音助手,OPPO小布技術(shù)總監(jiān)楊振宇在現(xiàn)場表示,融合悟道大模型的生成式問答系統(tǒng),解決了小布助手開放式對話的長尾問題,單條回答建設(shè)成本降低99%。
“悟道”開放平臺面向所有中小型企業(yè)、行業(yè)應(yīng)用企業(yè)和IT領(lǐng)軍企業(yè)提供一站式服務(wù),包括數(shù)據(jù)服務(wù)、在線訓(xùn)練、模型調(diào)優(yōu)、模型評測、在線部署,可通過API開放接口一鍵調(diào)用。
需求多樣化與場景碎片化是AI落地普遍存在的難點,智源研究院針對不同企業(yè)主體通過API既降低了應(yīng)用門檻,也滿足了特定化需求。正常來講,百億級大模型訓(xùn)練一次通常需要512張A100卡,約合人民幣六千萬。而對于數(shù)據(jù)不足、算力不足的中小企業(yè),悟道開放平臺提供十億級別模型的在線訓(xùn)練與微調(diào)。唐杰教授表示悟道開放平臺在快捷易用的同時,更注重解決規(guī)?;?、產(chǎn)業(yè)化AI應(yīng)用問題。目前平臺提供了寫詩、問答、繪畫等7種API功能。
解決可用問題之后,是如何幫助企業(yè)實現(xiàn)降本增效。悟道發(fā)布的開源大模型高效推理工具包BMInf,實現(xiàn)了“一卡頂四卡”,支持在低配置的NVIDIA GTX 1060單卡機上運行百億大模型。
智源研究團隊對原CPM2模型進行了基于INT8優(yōu)化的微調(diào),使得模型參數(shù)的存儲空間從40G壓縮到了10G,且性能基本保持不變。CPM2是為提高大模型精度和效率,研發(fā)的從模型、訓(xùn)練、微調(diào)到推理的全鏈路高效訓(xùn)練框架。此外,針對部分顯卡顯存不足的情況,工具包通過顯存和內(nèi)存間的調(diào)度與優(yōu)化,實現(xiàn)了低性能顯卡的大模型推理。
唐杰教授表示,原CPM2模型現(xiàn)已升級到CPM2.1,新模型通過持續(xù)學(xué)習(xí),引入基于生成的預(yù)訓(xùn)練任務(wù),在保留補全能力的條件下大幅提升了文本生成能力。
繼今年6月份超越DALL·E取得MS COCO榜單第一后,CogView也進行了全新升級。CogView可以根據(jù)文本提示生成對應(yīng)圖像,優(yōu)化后其圖像生成能力實現(xiàn)了4倍提速,4倍清晰。CogView的繪畫能力可應(yīng)用于服裝、海報等設(shè)計行業(yè)。
對話模型EVA是智源悟道團隊的最新研發(fā)成果,作為一款生成式對話系統(tǒng),EVA模型主打高情商,能夠借鑒心理咨詢助人理論,實現(xiàn)深度情緒安撫,讓人機聊天更有溫度。除了心情聊天外,它還支持大模型在線群聊等多類趣味對話應(yīng)用,有望推動“人與物”交流的現(xiàn)在時代邁進到“物與物”交流的人機共融未來時態(tài)。
基于以上能力,悟道大模型將在醫(yī)療、金融、新聞傳播等行業(yè)有著廣泛的應(yīng)用空間。例如在金融、法律、零售等傳統(tǒng)行業(yè)領(lǐng)域,大模型能提供高性能的智能信息解析和提取、智能數(shù)據(jù)整合、自動機器翻譯、輔助決策等功能,提升業(yè)務(wù)流程效率和水平。在新聞傳播領(lǐng)域,基于模型可實現(xiàn)智能新聞線索收集、機器寫作、輔助編輯、虛擬主播等應(yīng)用。
在大會現(xiàn)場,OPPO小布助手技術(shù)總監(jiān)楊振宇發(fā)布了與智源研究院合作的首款應(yīng)用——基于悟道大模型的“生成式問答系統(tǒng)”,大模型黑科技加持,小布助手在一定程度上解決行業(yè)共通的長尾問題。
AI語音技術(shù)在智能助手應(yīng)用有著較為成熟的落地方案,智能家居、智能車載、新聞播報、智能終端等場景也有廣泛的應(yīng)用案例。但現(xiàn)階段,“檢索式回答”是大多虛擬助手的主要人機交互方式之一,對話內(nèi)容局限于模型自建庫和互聯(lián)網(wǎng)數(shù)據(jù),這意味著,諸如長江長還是黃河長這類問題,如果無法在數(shù)據(jù)庫中找到答案,在度秘、搜狗助手、阿里夸克等途徑也無法查詢到的話,虛擬助手就無法做出回答。
從長尾問題來看,小布助手以及整個行業(yè)普遍存在的以下難題:
大量用戶提問(至少有1億),AI語音助手無法回答
長尾單個問題命中率低、體量大且無法窮盡
自建語料庫周期長,人工數(shù)據(jù)標(biāo)注成本高
針對這些問題,悟道開放平臺提供了兩套解決方案:一是針對小布助手現(xiàn)有用戶已經(jīng)提出的問題生成回答?!拔虻馈贝竽P途哂袕姶蟮男颖緦W(xué)習(xí)以及文本的理解與生成能力。
二是針對用戶未來可能問到的問題,通過“悟道”大模型結(jié)合知識圖譜,持續(xù)學(xué)習(xí),形成持續(xù)知識預(yù)訓(xùn)練模型,進而生成問答QA語料庫。目前每臺機器每天生成10萬左右的待審核答案,單條回答的建設(shè)成本降低了99%。
智源研究院學(xué)術(shù)副院長、清華大學(xué)教授唐杰與OPPO數(shù)智工程系統(tǒng)總裁劉海峰接受媒體采訪
在會后采訪中唐杰教授表示,他希望打造出更加智能的知識型、交互型、聊天式的智能助手,在回答人類提問時能夠更開放,風(fēng)格更多樣化。當(dāng)然,人性化的互動目標(biāo)對模型的自然語言理解和生成提出了更高的要求,目前還沒有更好的解決方案,但悟道大模型正在朝著這個方向邁進。
另外,此次發(fā)布的基于悟道大模型的冬奧手語播報數(shù)字人,將在北京冬奧會期間正式投入應(yīng)用,提供全流程智能化的數(shù)字人手語生成服務(wù),方便聽障人士也能收看賽事專題報道。
從大煉模型,到煉大模型,智源研究院是其中強有力的推動者,從世界最大到產(chǎn)業(yè)落地,智源“悟道”一直堅持前沿引領(lǐng)。在他們看來,大模型的興起的背后,是邁向通用人工智能的一條極富潛力的路徑,也是推動傳統(tǒng)行業(yè)實現(xiàn)智能化改造和升級的新機遇?,F(xiàn)階段,更智能的對話客服、更高效的機器翻譯、更智能的語音播報在電商、媒體、金融等領(lǐng)域已經(jīng)表現(xiàn)出極大的發(fā)展空間,而“大算力+大數(shù)據(jù)+大參數(shù)”也驗證了模型越大,智能潛力越大。
黃鐵軍院長告訴AI科技評論,人工智能的潛力取決于數(shù)據(jù),未來科學(xué)研究領(lǐng)域突破數(shù)據(jù)獲取的局限,大模型還有更廣闊的應(yīng)用空間。悟道大模型就像「發(fā)電廠」,會形成類似于電網(wǎng)的智能基礎(chǔ)平臺,為全社會源源不斷地供應(yīng)「智力源」。目前,以GPT-3、Switch Transformer為代表,布局大模型已成為世界性趨勢,國內(nèi)百度、阿里達摩院、華為&循環(huán)智能等企業(yè)和科研機構(gòu)也已相繼推出大模型ERNIE3、M6和盤古NLP。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。