丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給我在思考中
發(fā)送

0

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

本文作者: 我在思考中 2022-05-06 09:58
導(dǎo)語:Jurassic-X的前身是對標(biāo)GPT-3的Jurassic-1。

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

解讀 | Antonio

編輯丨陳彩嫻

近期,一家以色列NLP研究機(jī)構(gòu)AI21 Labs開發(fā)了一個名叫Jurassic-X的算法系統(tǒng),它基于該實驗室提出來的MRKL(它與miracle諧音)系統(tǒng)。Jurassic-X的前身是對標(biāo)GPT-3的Jurassic-1,然而卻克服了它們不擅于推理、更新昂貴、不能有效處理時序數(shù)據(jù)等缺點(diǎn)。

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

論文地址:https://arxiv.org/pdf/2204.10019.pdf



1

MRKL系統(tǒng)

MRKL的全稱是模塊化推理、知識和語言系統(tǒng)(Modular Reasoning, Knowledge and Language),它試圖將現(xiàn)有的神經(jīng)網(wǎng)絡(luò)模型,如大規(guī)模語言模型LLM,和外部知識庫,以及過去流行的符號專家系統(tǒng)結(jié)合在一起,從而來兼顧神經(jīng)模型和符號推理能力。

這一系統(tǒng)是針對現(xiàn)有的大規(guī)模語言模型的諸多缺點(diǎn)進(jìn)行的改進(jìn)。在GPT-3以及Jurassic-1等大規(guī)模語言模型進(jìn)行預(yù)訓(xùn)練,之后應(yīng)用在多個下游任務(wù),常常有兩種極端的方式:

(1)多個任務(wù)直接通過零樣本學(xué)習(xí)的方式進(jìn)行。這種方式無需更新任何參數(shù),從而保證了多功能性(versatility);

(2)在每個任務(wù)上都對于大規(guī)模語言模型進(jìn)行微調(diào)。這種方式不僅需要大量的資源,具有很差的遷移性,還會經(jīng)常導(dǎo)致在一個任務(wù)微調(diào)完之后,其余任務(wù)表現(xiàn)得很差——災(zāi)難性遺忘(catastrophic forgetting)的困境。

基于MRKL系統(tǒng)的Jurassic-X則主要借鑒了類似于prompt learning的方式,來凍結(jié)大部分模型原有的參數(shù),僅更新一部分任務(wù)相關(guān)的參數(shù)來避免上述問題。之后會對這塊的方法有一個初步的介紹。

同時,僅僅依賴神經(jīng)語言模型,也會有很多本質(zhì)上的問題:它們對于外部知識無法高效利用,尤其對于一些時序更新的數(shù)據(jù),例如新冠疫情最新的數(shù)據(jù)以及貨幣匯率等信息,它們的推理能力很弱,例如最簡單的算術(shù)題(自然語言給出的)有時候都會犯錯。

舉例來說:

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

問題:在最近的一個月里,哪一家清潔能源公司有最大的份額增長?

這是一個組合的“多專家”問題:首先模型會從例如百科庫WIKI接口中獲取有哪些清潔能源公司,之后它會從日歷中獲取上個月指的是什么時候,以及從數(shù)據(jù)庫中獲取相應(yīng)的份額增長;之后在匯總了上述信息后,它可以通過一個計算器去計算“最大的增長”,最后通過語言模型來給出答案。

要完成這些目標(biāo)需要訓(xùn)練離散的專家系統(tǒng),將他們的接口和神經(jīng)網(wǎng)絡(luò)之間進(jìn)行平滑,并在不同的模塊之間去選擇等等。一些技術(shù)細(xì)節(jié)可以參考介紹MRKL的文章,之后會針對其中在下游任務(wù)上的訓(xùn)練方式做一個簡要的介紹,更詳細(xì)的技術(shù)細(xì)節(jié)可以參考論文。

財富雜志從商業(yè)角度分析了MRKL以及Jurassic-X反映了當(dāng)代AI的四個趨勢:通用性、基于LLM、混合系統(tǒng)、減少權(quán)重訓(xùn)練。



2

通用性和基于LLM

MRKL致力于僅使用單一模型解決各種各樣的自然語言任務(wù),而并不是像現(xiàn)階段很多模型只能解決特定的單一任務(wù),這是朝著通用人工智能的必經(jīng)之路。例如,一個流暢的機(jī)器人對話系統(tǒng)不僅僅能順暢地完成對話,還可以同時對某些話語進(jìn)行情感分析。事實上,GPT-3等大規(guī)模模型已經(jīng)顯示出它的在多個任務(wù)上零樣本學(xué)習(xí)的巨大潛力了,而大規(guī)模語言模型預(yù)訓(xùn)練,多個任務(wù)共享該模型進(jìn)行微調(diào)早已成為研究界熟悉的訓(xùn)練范式了,商業(yè)上緊跟其后,也是預(yù)料之中。

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

對標(biāo)GPT-3的LLM:Jurassic-1



3

混合系統(tǒng)

盡管基于神經(jīng)模型的方式獲得了令人印象深刻的性能,不過GPT-3在涉及到一些哪怕是很簡單的推理時也會犯一些低級錯誤,尤其涉及到比較復(fù)雜的語言描述,例如多個數(shù)相加;涉及到最新的消息,例如紐約現(xiàn)在的天氣。它僅僅從過去訓(xùn)練好的數(shù)據(jù)中進(jìn)行推斷天氣情況,難以遷移到新的場景下,而如果用更新的數(shù)據(jù),則需要重新訓(xùn)練模型,而這需要巨大的代價。

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

不同專家系統(tǒng)之間的連接

因此MRKL使用了代表當(dāng)代AI在商業(yè)角度下的第三個趨勢——使用神經(jīng)和符號結(jié)合的混合系統(tǒng)。MRKL融合了不同的模塊,有些模塊使用了深度學(xué)習(xí),有些則使用符號推理模式的專家系統(tǒng),例如直接從某些數(shù)據(jù)知識庫中進(jìn)行檢索等模塊,來獲取更新的信息。

MRKL中一個出色的設(shè)計被稱作是路由(router)的模塊,它可以根據(jù)用戶的問題匹配一個專家系統(tǒng):例如如果問題涉及到數(shù)學(xué),它會轉(zhuǎn)向一個計算器,如果問題涉及到匯率,它會路由到一個匯率轉(zhuǎn)換器,如果是天氣的話,它會轉(zhuǎn)到一個天氣網(wǎng)站等等;如果路由對于問題不確定,它會先通過Jurassic-1等語言模型利用上下文推斷出應(yīng)該轉(zhuǎn)向哪個專家模塊。



4

權(quán)重更新方式

MRKL還采用了prompt tuning的方式對于模型的下游任務(wù)進(jìn)行更新,如上述,這種方式避免了災(zāi)難性遺忘的微調(diào)模式以及零樣本學(xué)習(xí)的低性能。與傳統(tǒng)的prompt tuning方式相比,Jurassic-X使用了更加精細(xì)的設(shè)計:(1)依賴于模型輸入的prompt學(xué)習(xí)方式。(2)檢索增強(qiáng)的prompt生成方式。(3)遞歸式地應(yīng)用凍結(jié)了的LM模型。論文中做了更加詳細(xì)的技術(shù)介紹,感興趣的讀者可以直接閱讀論文。

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

MRKL中采用遞歸方式涉及prompt learning



5

應(yīng)用實例

博客中介紹了幾種MRKL的應(yīng)用場景舉例,都是一些值得關(guān)注和實用的一些話題,涉及到方方面面可能出現(xiàn)在日常場景中的問題。

用人類語言去閱讀和更新數(shù)據(jù)庫

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

問題:買玫瑰味的洗發(fā)水

Jurassic-X會從人類語言中提取中關(guān)鍵信息,并從商店清單中去檢索產(chǎn)品,加入到購物車的數(shù)據(jù)庫中。這在智能助理,電子商務(wù)等都有應(yīng)用前景。

對于當(dāng)下問題的文本生成

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

問題:誰是當(dāng)下的美國總統(tǒng)

Jurassic-X會融合當(dāng)下及時更新的外部數(shù)據(jù)庫,例如維基百科去產(chǎn)生更及時的數(shù)據(jù)。

數(shù)學(xué)操作

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

問題:公司的655400份份額被94個員工平均分配,每個員工得到多少?

Jurassic-X會通過語言模型提出去關(guān)鍵信息,并且應(yīng)該去尋找一個“數(shù)學(xué)專家”,也就是計算器,從而得出正確結(jié)果。

組合型問題

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

問題:更多的人住在Tel Aviv還是Berlin?

Jurassic會將組合型問題分解為若干子問題:Tel Aviv的人口是多少?Berlin人口是多少?哪個數(shù)字更大?等,解決了每個子問題后再把它們匯總在一起。更重要的是,這樣也增加了可解釋性,說明了模型給出答案的依據(jù)。

天氣、匯率等動態(tài)信息

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

問題:100美元可以換多少摩洛哥幣?

Jurassic會把語言模型和一些及時更新的知識庫融合在一起,從而容易獲取到實踐性敏感的動態(tài)信息。

透明性和可信性

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

問題:克林頓是否曾經(jīng)當(dāng)選過美國總統(tǒng)

這里涉及到Clinton的歧義問題,問題的答案取決于哪個Clinton,是Bill Clinton還是他的妻子。Jurassic-X可以做出更加明確、透明的回答,而其他神經(jīng)模型則不行。



6

AI21 Labs

AI21實驗室位于以色列的一家自然語言處理的研究機(jī)構(gòu);它同時也是一個商業(yè)機(jī)構(gòu),旨在將現(xiàn)有的NLP技術(shù)快速部署到商業(yè)應(yīng)用中。創(chuàng)始人包括從斯坦福大學(xué)退休了的人工智能教授Yoav Shoham;一家自動駕駛公司Mobileye的創(chuàng)始人Amnon Shashua,以及眾包平臺CrowdX創(chuàng)始人Ori Goshen。這家公司的口號是“重構(gòu)人們的讀寫方式,朝向更美好的未來”(reimaging the way people read and write, for the better)。

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

參考鏈接

https://fortune.com/2022/04/19/ai21-labs-mrkl-ultra-large-language-models-jurassic/

https://storage.cloud.google.com/ai21-public-data/publications/MRKL_paper.pdf

https://arxiv.org/pdf/2204.10019.pdf

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

Jurassic-X: 讓神經(jīng)模型學(xué)會符號推理

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說