0
本文作者: 貝爽 | 2021-09-26 16:55 |
悟道2.0,要怎么用起來?
連創(chuàng)“中國(guó)首個(gè)”和“世界最大”兩項(xiàng)記錄后,悟道大模型的落地應(yīng)用成為業(yè)界關(guān)心的熱點(diǎn)話題。
GPT-3的問世掀起了一股“煉大模型”的浪潮,去年10月,北京智源研究院集結(jié)中國(guó)產(chǎn)學(xué)界100多位AI專家聯(lián)合攻關(guān),在一年之內(nèi)發(fā)布了1.75萬億級(jí)大規(guī)模預(yù)訓(xùn)練模型悟道2.0,超越GPT-3、Switch Transformer,成為全球最大萬億級(jí)人工智能大模型。
時(shí)至今日,“產(chǎn)業(yè)應(yīng)用”成為未來人工智能大模型時(shí)代的下一個(gè)賽點(diǎn)。
GPT-3早早開放了API供開發(fā)者使用。據(jù)OpenAI透露,截止今年3月,全球已有300多個(gè)APP采用了GPT-3技術(shù),基于GPT-3的應(yīng)用也有100多個(gè);今年悟道2.0發(fā)布會(huì)上,智源研究院?jiǎn)?dòng)大模型產(chǎn)業(yè)生態(tài)建設(shè)規(guī)劃,表示悟道大模型下一步將作為AI基礎(chǔ)設(shè)施,像“發(fā)電廠”一樣為不同行業(yè)、企業(yè)、個(gè)人開發(fā)者賦能。
9月24日,智源研究院承辦2021中關(guān)村論壇“人工智能與多學(xué)科協(xié)同創(chuàng)新”平行論壇,圍繞“人工智能大模型時(shí)代學(xué)科交叉和可持續(xù)發(fā)展”展開深入交流。會(huì)上,智源研究院學(xué)術(shù)副院長(zhǎng)、清華大學(xué)教授唐杰公布了悟道2.0產(chǎn)業(yè)應(yīng)用的最新進(jìn)展,并發(fā)布了一系列技術(shù)創(chuàng)新成果。
唐杰教授表示,悟道大模型應(yīng)用技術(shù)正在像“低門檻+高效率+高情商”三個(gè)方向努力,能夠滿足不同行業(yè)和企業(yè)實(shí)現(xiàn)規(guī)?;?、產(chǎn)業(yè)化的應(yīng)用需求,悟道正在從最大向“更好用”邁進(jìn)。
此次技術(shù)創(chuàng)新包括:“悟道”大模型開發(fā)平臺(tái)、大模型高效推理工具包BMInf、全新升級(jí)的AI文圖繪畫大師CogView和實(shí)現(xiàn)大模型群聊的對(duì)話模型EVA。
大會(huì)現(xiàn)場(chǎng)還發(fā)布了“悟道2.0”賦能產(chǎn)業(yè)應(yīng)用案例:冬奧會(huì)語(yǔ)音播報(bào)數(shù)字人和OPPP小布助手問答系統(tǒng)。小布助手是OPPO旗下開放式對(duì)話虛擬語(yǔ)音助手,OPPO小布技術(shù)總監(jiān)楊振宇在現(xiàn)場(chǎng)表示,融合悟道大模型的生成式問答系統(tǒng),解決了小布助手開放式對(duì)話的長(zhǎng)尾問題,單條回答建設(shè)成本降低99%。
“悟道”開放平臺(tái)面向所有中小型企業(yè)、行業(yè)應(yīng)用企業(yè)和IT領(lǐng)軍企業(yè)提供一站式服務(wù),包括數(shù)據(jù)服務(wù)、在線訓(xùn)練、模型調(diào)優(yōu)、模型評(píng)測(cè)、在線部署,可通過API開放接口一鍵調(diào)用。
需求多樣化與場(chǎng)景碎片化是AI落地普遍存在的難點(diǎn),智源研究院針對(duì)不同企業(yè)主體通過API既降低了應(yīng)用門檻,也滿足了特定化需求。正常來講,百億級(jí)大模型訓(xùn)練一次通常需要512張A100卡,約合人民幣六千萬。而對(duì)于數(shù)據(jù)不足、算力不足的中小企業(yè),悟道開放平臺(tái)提供十億級(jí)別模型的在線訓(xùn)練與微調(diào)。唐杰教授表示悟道開放平臺(tái)在快捷易用的同時(shí),更注重解決規(guī)?;a(chǎn)業(yè)化AI應(yīng)用問題。目前平臺(tái)提供了寫詩(shī)、問答、繪畫等7種API功能。
解決可用問題之后,是如何幫助企業(yè)實(shí)現(xiàn)降本增效。悟道發(fā)布的開源大模型高效推理工具包BMInf,實(shí)現(xiàn)了“一卡頂四卡”,支持在低配置的NVIDIA GTX 1060單卡機(jī)上運(yùn)行百億大模型。
智源研究團(tuán)隊(duì)對(duì)原CPM2模型進(jìn)行了基于INT8優(yōu)化的微調(diào),使得模型參數(shù)的存儲(chǔ)空間從40G壓縮到了10G,且性能基本保持不變。CPM2是為提高大模型精度和效率,研發(fā)的從模型、訓(xùn)練、微調(diào)到推理的全鏈路高效訓(xùn)練框架。此外,針對(duì)部分顯卡顯存不足的情況,工具包通過顯存和內(nèi)存間的調(diào)度與優(yōu)化,實(shí)現(xiàn)了低性能顯卡的大模型推理。
唐杰教授表示,原CPM2模型現(xiàn)已升級(jí)到CPM2.1,新模型通過持續(xù)學(xué)習(xí),引入基于生成的預(yù)訓(xùn)練任務(wù),在保留補(bǔ)全能力的條件下大幅提升了文本生成能力。
繼今年6月份超越DALL·E取得MS COCO榜單第一后,CogView也進(jìn)行了全新升級(jí)。CogView可以根據(jù)文本提示生成對(duì)應(yīng)圖像,優(yōu)化后其圖像生成能力實(shí)現(xiàn)了4倍提速,4倍清晰。CogView的繪畫能力可應(yīng)用于服裝、海報(bào)等設(shè)計(jì)行業(yè)。
對(duì)話模型EVA是智源悟道團(tuán)隊(duì)的最新研發(fā)成果,作為一款生成式對(duì)話系統(tǒng),EVA模型主打高情商,能夠借鑒心理咨詢助人理論,實(shí)現(xiàn)深度情緒安撫,讓人機(jī)聊天更有溫度。除了心情聊天外,它還支持大模型在線群聊等多類趣味對(duì)話應(yīng)用,有望推動(dòng)“人與物”交流的現(xiàn)在時(shí)代邁進(jìn)到“物與物”交流的人機(jī)共融未來時(shí)態(tài)。
基于以上能力,悟道大模型將在醫(yī)療、金融、新聞傳播等行業(yè)有著廣泛的應(yīng)用空間。例如在金融、法律、零售等傳統(tǒng)行業(yè)領(lǐng)域,大模型能提供高性能的智能信息解析和提取、智能數(shù)據(jù)整合、自動(dòng)機(jī)器翻譯、輔助決策等功能,提升業(yè)務(wù)流程效率和水平。在新聞傳播領(lǐng)域,基于模型可實(shí)現(xiàn)智能新聞線索收集、機(jī)器寫作、輔助編輯、虛擬主播等應(yīng)用。
在大會(huì)現(xiàn)場(chǎng),OPPO小布助手技術(shù)總監(jiān)楊振宇發(fā)布了與智源研究院合作的首款應(yīng)用——基于悟道大模型的“生成式問答系統(tǒng)”,大模型黑科技加持,小布助手在一定程度上解決行業(yè)共通的長(zhǎng)尾問題。
AI語(yǔ)音技術(shù)在智能助手應(yīng)用有著較為成熟的落地方案,智能家居、智能車載、新聞播報(bào)、智能終端等場(chǎng)景也有廣泛的應(yīng)用案例。但現(xiàn)階段,“檢索式回答”是大多虛擬助手的主要人機(jī)交互方式之一,對(duì)話內(nèi)容局限于模型自建庫(kù)和互聯(lián)網(wǎng)數(shù)據(jù),這意味著,諸如長(zhǎng)江長(zhǎng)還是黃河長(zhǎng)這類問題,如果無法在數(shù)據(jù)庫(kù)中找到答案,在度秘、搜狗助手、阿里夸克等途徑也無法查詢到的話,虛擬助手就無法做出回答。
從長(zhǎng)尾問題來看,小布助手以及整個(gè)行業(yè)普遍存在的以下難題:
大量用戶提問(至少有1億),AI語(yǔ)音助手無法回答
長(zhǎng)尾單個(gè)問題命中率低、體量大且無法窮盡
自建語(yǔ)料庫(kù)周期長(zhǎng),人工數(shù)據(jù)標(biāo)注成本高
針對(duì)這些問題,悟道開放平臺(tái)提供了兩套解決方案:一是針對(duì)小布助手現(xiàn)有用戶已經(jīng)提出的問題生成回答。“悟道”大模型具有強(qiáng)大的小樣本學(xué)習(xí)以及文本的理解與生成能力。
二是針對(duì)用戶未來可能問到的問題,通過“悟道”大模型結(jié)合知識(shí)圖譜,持續(xù)學(xué)習(xí),形成持續(xù)知識(shí)預(yù)訓(xùn)練模型,進(jìn)而生成問答QA語(yǔ)料庫(kù)。目前每臺(tái)機(jī)器每天生成10萬左右的待審核答案,單條回答的建設(shè)成本降低了99%。
智源研究院學(xué)術(shù)副院長(zhǎng)、清華大學(xué)教授唐杰與OPPO數(shù)智工程系統(tǒng)總裁劉海峰接受媒體采訪
在會(huì)后采訪中唐杰教授表示,他希望打造出更加智能的知識(shí)型、交互型、聊天式的智能助手,在回答人類提問時(shí)能夠更開放,風(fēng)格更多樣化。當(dāng)然,人性化的互動(dòng)目標(biāo)對(duì)模型的自然語(yǔ)言理解和生成提出了更高的要求,目前還沒有更好的解決方案,但悟道大模型正在朝著這個(gè)方向邁進(jìn)。
另外,此次發(fā)布的基于悟道大模型的冬奧手語(yǔ)播報(bào)數(shù)字人,將在北京冬奧會(huì)期間正式投入應(yīng)用,提供全流程智能化的數(shù)字人手語(yǔ)生成服務(wù),方便聽障人士也能收看賽事專題報(bào)道。
從大煉模型,到煉大模型,智源研究院是其中強(qiáng)有力的推動(dòng)者,從世界最大到產(chǎn)業(yè)落地,智源“悟道”一直堅(jiān)持前沿引領(lǐng)。在他們看來,大模型的興起的背后,是邁向通用人工智能的一條極富潛力的路徑,也是推動(dòng)傳統(tǒng)行業(yè)實(shí)現(xiàn)智能化改造和升級(jí)的新機(jī)遇?,F(xiàn)階段,更智能的對(duì)話客服、更高效的機(jī)器翻譯、更智能的語(yǔ)音播報(bào)在電商、媒體、金融等領(lǐng)域已經(jīng)表現(xiàn)出極大的發(fā)展空間,而“大算力+大數(shù)據(jù)+大參數(shù)”也驗(yàn)證了模型越大,智能潛力越大。
黃鐵軍院長(zhǎng)告訴AI科技評(píng)論,人工智能的潛力取決于數(shù)據(jù),未來科學(xué)研究領(lǐng)域突破數(shù)據(jù)獲取的局限,大模型還有更廣闊的應(yīng)用空間。悟道大模型就像「發(fā)電廠」,會(huì)形成類似于電網(wǎng)的智能基礎(chǔ)平臺(tái),為全社會(huì)源源不斷地供應(yīng)「智力源」。目前,以GPT-3、Switch Transformer為代表,布局大模型已成為世界性趨勢(shì),國(guó)內(nèi)百度、阿里達(dá)摩院、華為&循環(huán)智能等企業(yè)和科研機(jī)構(gòu)也已相繼推出大模型ERNIE3、M6和盤古NLP。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。