Uber AI簡(jiǎn)單方法實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的精細(xì)控制

本文作者：楊曉凡

2019-12-11 10:26

導(dǎo)語(yǔ)：就像讓小老鼠控制一只猛犸象

雷鋒網(wǎng) AI 科技評(píng)論按：OpenAI 的 GPT-2 曾經(jīng)掀起的「大規(guī)模語(yǔ)言模型到底水平多高、到底有沒(méi)有危害」的口水仗慢慢冷下去了，而語(yǔ)言模型的實(shí)用性問(wèn)題也越來(lái)越展現(xiàn)出來(lái)：如果很難控制一個(gè)語(yǔ)言模型的輸出，那可能就很難找到它的實(shí)際應(yīng)用，只能淪為刷分工具。

近期，Uber AI 研究院的一篇論文《Plug and Play Language Models: A Simple Approach To Controlled Text Generation》（https://arxiv.org/abs/1912.02164）中介紹了一種簡(jiǎn)單、高效的精細(xì)控制方法，可以輕松地讓大規(guī)模語(yǔ)言模型生成指定的主題、風(fēng)格的文本，而且還有很廣泛的適用性。Uber AI 的研究人員們把它比喻為「讓小老鼠控制一只猛犸象」。雷鋒網(wǎng) AI 科技評(píng)論把論文的解讀博客編譯如下。

Uber AI簡(jiǎn)單方法實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的精細(xì)控制

一個(gè)實(shí)際的挑戰(zhàn)：基于預(yù)訓(xùn)練模型的條件文本生成

2017 年谷歌提出的基于注意力的 Transformer 網(wǎng)絡(luò)架構(gòu)為自然語(yǔ)言處理開(kāi)辟了一個(gè)全新的時(shí)代。從此之后，基于 Transformer 改進(jìn)的更大、更大的模型層出不窮，基于深度學(xué)習(xí)的自然語(yǔ)言處理方法也在各種各樣的任務(wù)中取得越來(lái)越好的成績(jī)。

隨著 BERT、GPT-2 之類的大規(guī)模語(yǔ)言模型出現(xiàn)，NLP 研究者們通過(guò)實(shí)驗(yàn)表明了只需要用簡(jiǎn)單的目標(biāo)函數(shù)在超大規(guī)模的無(wú)標(biāo)注語(yǔ)料上訓(xùn)練，得到的語(yǔ)言模型就可以在語(yǔ)言建模任務(wù)（給定一組開(kāi)頭以后向后續(xù)寫(xiě)）中得到前所未有的流暢度，文本的自然、合理程度可以接近人類水平。

比如，給定一個(gè)開(kāi)頭「這里的食物不好吃」，一個(gè)語(yǔ)言模型（比如 GPT-2）能續(xù)寫(xiě)成這樣的看上去相當(dāng)合理的一段話「這里的食物不好吃，店員又懶又粗魯。這食物真讓人喜歡不起來(lái)，即便我的要求一點(diǎn)也不高。」

不過(guò)，雖然這些模型生成的句子體現(xiàn)出了拼寫(xiě)、語(yǔ)法、語(yǔ)言習(xí)慣等等復(fù)雜的語(yǔ)言知識(shí)，但想要具體地控制模型生成的內(nèi)容仍然非常困難。換句話說(shuō)，雖然模型有能力生成各種各樣不同的句子，或者為一個(gè)給定的開(kāi)頭續(xù)寫(xiě)出很多不同的段落，但我們很難指定讓模型生成某一種風(fēng)格的、某一種話題的、某一種敘述邏輯的文字。比如，同樣是以開(kāi)頭「這里的食物不好吃」進(jìn)行續(xù)寫(xiě)，人類可以欲揚(yáng)先抑，最后得到一個(gè)正面的結(jié)論，也可以掛羊頭賣(mài)狗肉，話說(shuō)到一半慢慢從講食物變成講政治的。想讓語(yǔ)言模型做到這些就非常困難。

在這篇論文里，Uber AI 的研究人員們?cè)谶@個(gè)問(wèn)題上做出了一些突破。我們先看一個(gè)例子，他們用他們的方法要求模型生成一段正面的續(xù)寫(xiě)，效果是：「這里的食物很糟糕，但還有音樂(lè)、故事和魔力！Avenged Sevenfold 的搖滾音樂(lè)劇演得太精彩，以后在全世界都能看到?！刮谋颈磉_(dá)的情感從負(fù)面轉(zhuǎn)變成了正面，但還是挺連貫自然的。

在此之前，全世界的 NLP 研究人員們提出過(guò)各種各樣的條件文本生成方式，包括，1，從一個(gè)預(yù)訓(xùn)練語(yǔ)言模型開(kāi)始，做精細(xì)調(diào)節(jié)，以便讓它始終都能生成某種特定風(fēng)格的句子；2，從零開(kāi)始訓(xùn)練一個(gè)大型條件生成模型；3，不改變這個(gè)大的語(yǔ)言模型，而是通過(guò)關(guān)鍵 n 元組替換的方式，調(diào)節(jié)已經(jīng)生成的句子的風(fēng)格。

Uber AI 這篇論文帶來(lái)了一種全新的有控制的文本生成方式，他們稱之為「the Plug and Play Language Model」（即插即用語(yǔ)言模型，PPLM）。通過(guò) PPLM，用戶可以向大型非條件性的生成模型中靈活地插入一個(gè)或多個(gè)屬性模型，這些插入的模型可以代表不同的想要控制的屬性。PPLM 的最大優(yōu)點(diǎn)是不需要對(duì)語(yǔ)言模型做任何額外的改動(dòng)（不需要重新訓(xùn)練或者精細(xì)調(diào)節(jié)），就讓資源不足的研究人員也可以直接在預(yù)訓(xùn)練語(yǔ)言模型的基礎(chǔ)上生成條件文本。

如何駕馭一頭猛犸象

Uber AI簡(jiǎn)單方法實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的精細(xì)控制

NLP 研究人員們目前開(kāi)發(fā)的最大的、語(yǔ)言能力最強(qiáng)的語(yǔ)言模型都非常大，動(dòng)輒有數(shù)十億的參數(shù)，訓(xùn)練它們需要大量的計(jì)算資源（從零訓(xùn)練一個(gè)模型，租算力大概需要六萬(wàn)美元），而且訓(xùn)練這些模型還需要海量的文本數(shù)據(jù)，即便模型的代碼是開(kāi)源的，這些訓(xùn)練數(shù)據(jù)也通常不是開(kāi)源的。在許多意義上，大規(guī)模語(yǔ)言模型就像猛犸象一樣，它們聰明、有力，但是它們的行動(dòng)又隨意又笨重。

這樣的語(yǔ)言模型帶來(lái)的結(jié)果就是，除了那些有最充沛的資源和資金的研究人員之外，其它的研究人員和開(kāi)發(fā)者都只能在無(wú)論如何都不理想的情境中三選一：1，直接使用公開(kāi)的預(yù)訓(xùn)練模型（雖然有好的語(yǔ)言建模能力但無(wú)法完全匹配他們的需求）；2，在小一些的數(shù)據(jù)集上對(duì)預(yù)訓(xùn)練模型做精細(xì)調(diào)節(jié)（但一旦出現(xiàn)災(zāi)難性遺忘，就會(huì)讓模型的表現(xiàn)大幅下降）；3，需求不符只能從零訓(xùn)練新模型，但預(yù)算有限，只能訓(xùn)練小得多的模型（表現(xiàn)也自然也會(huì)有明顯差距）。

Uber AI 提出的 PPLM 就能在這樣的困境面前起到很大幫助，需要符合自己需求、且表現(xiàn)優(yōu)秀的語(yǔ)言模型的研究者和開(kāi)發(fā)者，不再需要想辦法訓(xùn)練自己的模型，只需要用幾個(gè)小的屬性模型控制大預(yù)訓(xùn)練模型的生成，就可以達(dá)到目標(biāo)。一個(gè)屬性模型可以只有預(yù)訓(xùn)練模型的百萬(wàn)分之一大，同時(shí)仍然有很強(qiáng)的引導(dǎo)能力，就像在猛犸象的頭頂坐了一只小老鼠，就能夠靈活地控制讓猛犸象往哪里走。

控制一個(gè)語(yǔ)言模型的不成功方法

語(yǔ)言模型有幾類，對(duì)應(yīng)幾種不同的分布。

首先有非條件性的語(yǔ)言模型，它的分布是 p(x)，是所有文本上的一個(gè)概率分布。GPT-2 之類的非條件性的語(yǔ)言模型就是建模了這樣的分布。這樣的語(yǔ)言模型是通用的，可以為許多不同種類的話題生成流暢的文本。

其次，條件性語(yǔ)言模型的分布是 p(x|a)，這就是我們的目標(biāo)。在給定某種屬性 a 之后，這種假想模型就可以生成帶有這種屬性的文本。

接下來(lái)，屬性模型的分布是 p(a|x)，它是根據(jù)給定的句子輸入 x 計(jì)算句子帶有屬性 a 的概率。比如，經(jīng)過(guò)屬性模型計(jì)算，某個(gè)句子有 10% 的可能性是正面情緒的，以及有 85% 的可能性是關(guān)于政治的。屬性模型可以很小、很容易訓(xùn)練，僅從直觀上來(lái)看，判斷某個(gè)句子是否含有某種屬性就是個(gè)分類任務(wù)，要比寫(xiě)出這樣的句子簡(jiǎn)單得多；尤其是，如果在語(yǔ)言模型學(xué)習(xí)的語(yǔ)言表征上訓(xùn)練這樣的屬性（識(shí)別）模型，OpenAI 的論文《Improving Language Understanding by Generative Pre-Training》就已經(jīng)表明了可以輕松地訓(xùn)練一個(gè)表現(xiàn)優(yōu)秀的小模型。在 Uber AI 的實(shí)驗(yàn)中，一個(gè)單層的、4000 個(gè)參數(shù)的屬性模型就能在屬性識(shí)別和文本生成引導(dǎo)中發(fā)揮很好的效果。

那么我們想要的條件性語(yǔ)言模型，也就是 p(x|a) 從哪里來(lái)呢？幸運(yùn)的是，根據(jù)貝葉斯法則，這個(gè)模型可以用第一個(gè)和第三個(gè)模型表示出來(lái)，也就是：

p(x|a) ∝ p(a|x) p(x)

不過(guò)，雖然這種方式讓我們可以方便地計(jì)算概率（「這個(gè)句子符不符合我們想要的樣子」），但我們很難從這種表達(dá)中采樣。我們可以先嘗試常見(jiàn)的拒絕采樣或者重要性采樣，從 p(x) 分布開(kāi)始逐一采樣篩選—— 這種做法理論上可行，但實(shí)際操作起來(lái)，要么會(huì)得到有偏倚的結(jié)果，要么運(yùn)行速度非常慢。想用這種方式生成一個(gè)談?wù)蔚木渥?，大概?huì)是這樣的狀況：

從 p(x) 中采樣得到一個(gè)句子 x
把句子 x 輸入 p(a|x) 計(jì)算它是否是關(guān)于政治的
如果不是，重復(fù)第一步

顯然，這就是從隨機(jī)生成的句子里把關(guān)于政治的句子挑出來(lái)而已，由于 p(x) 覆蓋了大量不同的話題，運(yùn)氣不好的話可能很久都無(wú)法得到關(guān)于政治的句子。對(duì)于越長(zhǎng)的句子，生成滿足要求的整句話也越難（需要越好的運(yùn)氣），花費(fèi)的時(shí)間會(huì)指數(shù)級(jí)增加。這簡(jiǎn)直像「無(wú)數(shù)多的猴子在無(wú)數(shù)多的打字機(jī)上隨機(jī)地打字，并持續(xù)無(wú)限長(zhǎng)的時(shí)間，那么在某個(gè)時(shí)候他們必然會(huì)打出莎士比亞的詩(shī)集」，理論上正確，但無(wú)法用在實(shí)踐中。

用梯度控制大規(guī)模語(yǔ)言模型

PPLM 解決這個(gè)問(wèn)題的方式是，他們用屬性模型通過(guò)梯度控制大語(yǔ)言模型。他們逼近實(shí)現(xiàn)了 1996 年的論文《Exponential convergence of Langevin distributions and their discrete approximations》中的更高效的 Metropolis-adjusted Langevin 采樣器，而且參考了 Plug-and-Play Generative Networks (PPGN，arxiv.org/abs/1612.00005)中在一對(duì)神經(jīng)網(wǎng)絡(luò)上的實(shí)現(xiàn)方式。這樣一來(lái)，PPLM 生成一個(gè)樣本就變成了這樣的簡(jiǎn)單的三步：

給定一個(gè)部分生成的句子，計(jì)算 log(p(x)) 、log(p(a|x))，以及兩者關(guān)于語(yǔ)言模型的隱層表征的梯度。只需要對(duì)屬性模型和語(yǔ)言模型都做一次高效的前饋傳播和反饋傳播，這幾個(gè)值都可以計(jì)算出來(lái)。
根據(jù)計(jì)算出的梯度，在反饋傳播中，根據(jù)屬性模型的梯度更新語(yǔ)言模型的隱層表征，向著增加 log(p(a|x)) 和 log(p(x)) 的方向移動(dòng)一小步，也就是增加了生成的文本帶有想要的屬性的概率
由于上一步更新，語(yǔ)言模型的分布被改變，然后采樣一個(gè)詞

Uber AI簡(jiǎn)單方法實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的精細(xì)控制

在每個(gè)時(shí)間步中，這個(gè)過(guò)程都會(huì)進(jìn)行一次，也就是說(shuō)表征了以往的值的隱層變量會(huì)被一次又一次地更新。

直觀上講，隨著 PPLM 生成一個(gè)個(gè)詞，它的文本表征也逐漸向著更有可能符合屬性要求的方向發(fā)生變化（高 log(p(a|x)) ），同時(shí)也保持了語(yǔ)言模型本來(lái)的語(yǔ)言流暢度（在第二步中保持高 log(p(x)，避免語(yǔ)言模型本來(lái)的表達(dá)能力被破壞）。

Uber AI 的研究人員們也對(duì) PPLM 做了一些相關(guān)的說(shuō)明：

首先，PPLM 的這種控制模式是可以調(diào)節(jié)的：對(duì)隱層文本表征的每一步變化的強(qiáng)度可以調(diào)節(jié)；當(dāng)變化強(qiáng)度設(shè)為 0 的時(shí)候，這就是原本的語(yǔ)言模型。
其次，PPLM 假設(shè)原有的基礎(chǔ)語(yǔ)言模型是自回歸的，許多現(xiàn)代的語(yǔ)言模型都符合這個(gè)要求。實(shí)際上，如果語(yǔ)言模型是基于 Transformer 架構(gòu)的，上面的這個(gè)方法就可以有高效的實(shí)現(xiàn)，因?yàn)橐酝念A(yù)測(cè)值只能通過(guò) Transformer 的以往的鍵和值對(duì)未來(lái)的預(yù)測(cè)產(chǎn)生影響，和其它的激活值都無(wú)關(guān)，所以在前向傳播中只有張量需要更新和傳遞。
以及，PPLM 中的采樣器的實(shí)現(xiàn)，和上面提到的《Exponential convergence of Langevin distributions and their discrete approximations》以及 PPGN，arxiv.org/abs/1612.00005 中的實(shí)現(xiàn)有一些重要的不同，感興趣的研究人員可以閱讀論文原文具體了解
最后，Uber AI 這項(xiàng)研究中選用的基礎(chǔ)語(yǔ)言模型是 345M 參數(shù)的 GPT-2，但對(duì)于其他的自回歸語(yǔ)言模型也是有效的。

不同屬性模型的不同表現(xiàn)

詞袋屬性模型

Uber AI 的研究人員們首先嘗試了最簡(jiǎn)單的一類屬性模型，詞袋模型（Bag-of-words），計(jì)算方式也就是直白的「符合主題的似然度等于詞袋中每個(gè)詞單獨(dú)的似然度的和」，換句話說(shuō)就是含有越多詞袋中的詞，就認(rèn)為句子符合屬性的可能性越高。

在這個(gè)實(shí)驗(yàn)中，他們想要生成太空主題的文本，詞袋中含有「planet、galaxy、space、universe」等等詞匯。即便給定不同的開(kāi)頭，模型生成的幾組結(jié)果都達(dá)到了預(yù)期效果。

Uber AI簡(jiǎn)單方法實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的精細(xì)控制

同一主題、不同開(kāi)頭實(shí)驗(yàn)

在下一個(gè)實(shí)驗(yàn)中，他們用同樣的開(kāi)頭、不同內(nèi)容的詞袋模型嘗試生成不同的主題。我們可以看到，生成的文本帶有詞袋中的詞的概率提升的同時(shí)，不在詞袋中、但有相關(guān)性的詞匯的出現(xiàn)概率也增加了。這是因?yàn)?，PPLM 中更新文本表征的方式是向著目標(biāo)方向的連貫自然的遷移，作者們也通過(guò)對(duì)照實(shí)驗(yàn)說(shuō)明這種做法的效果比直接提升想要的關(guān)鍵詞的出現(xiàn)頻率的效果更好。

Uber AI簡(jiǎn)單方法實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的精細(xì)控制

同一開(kāi)頭、不同主題實(shí)驗(yàn)

在苛刻的條件下，PPLM 的表現(xiàn)如何呢？這組實(shí)驗(yàn)中，給定和目標(biāo)話題完全不相關(guān)的開(kāi)頭，比如「以各種動(dòng)物/食物開(kāi)頭，主題是政治」。即便是這樣奇怪的開(kāi)頭，PPLM 也能生成合理的句子。

Uber AI簡(jiǎn)單方法實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的精細(xì)控制

有挑戰(zhàn)性的開(kāi)頭和主題

判別器屬性模型

詞袋模型固然是一個(gè)簡(jiǎn)單直觀的話題表征方式，但對(duì)于一些更復(fù)雜、深層次的屬性，比如正面和負(fù)面情緒，我們總還是需要更復(fù)雜一些的模型的。這種時(shí)候我們就可以使用在標(biāo)注數(shù)據(jù)集上訓(xùn)練出的分類模型。

Uber AI 的研究人員們?cè)O(shè)計(jì)的分類模型把原本的語(yǔ)言模型中提取出的嵌入表征作為輸入，用一個(gè)單層分類器結(jié)構(gòu)預(yù)測(cè)類別標(biāo)簽。這個(gè)模型中含有的參數(shù)可以不超過(guò) 5000 個(gè)，相比于語(yǔ)言模型的規(guī)?？芍^不值一提。

這樣得到的 PPLM-Discrim 模型生成正面和負(fù)面情感的文本效果如下圖

Uber AI簡(jiǎn)單方法實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的精細(xì)控制

多個(gè)屬性模型聯(lián)合使用

人類有能力在一段話中覆蓋多種主題，PPLM 也可以。Uber AI 的研究人員們嘗試了把多個(gè)詞袋模型和一個(gè)分類模型一起使用，可以讓一段話同時(shí)符合「冬天、政治、廚房」的主題，而且有正面情緒。圖中第二段同時(shí)符合「計(jì)算機(jī)、幻想、釣魚(yú)鏈接」主題。

Uber AI簡(jiǎn)單方法實(shí)現(xiàn)大規(guī)模語(yǔ)言模型的精細(xì)控制

多個(gè)屬性模型聯(lián)合，多主題文本生成

避免語(yǔ)言模型生成有害文本

在前面的敘述和例子中我們都看到了，PPLM 架構(gòu)可以使用任意可微的屬性模型引導(dǎo)語(yǔ)言模型生成各種不同屬性或者主題的文本。但在應(yīng)用中我們還會(huì)遇到一種問(wèn)題，由于大規(guī)模語(yǔ)言模型都是在海量的互聯(lián)網(wǎng)文本上訓(xùn)練的，這些文本經(jīng)常含有偏見(jiàn)或者使用不友善的（罵人）的詞匯。論文 arxiv.org/abs/1908.07125 就展示了，如果用對(duì)抗性攻擊的思路設(shè)計(jì)文本開(kāi)頭，可以讓 GPT-2 續(xù)寫(xiě)出帶有種族主義的段落。這種狀況會(huì)限制語(yǔ)言模型的安全應(yīng)用場(chǎng)景。

由于 PPLM 使用梯度來(lái)更新語(yǔ)言表征，解決這種問(wèn)題就要簡(jiǎn)單得多，只需要訓(xùn)練一個(gè)惡意文本分類器，把它作為屬性模型，然后使用負(fù)梯度更新語(yǔ)言表征，也就是減小生成文本符合屬性的概率即可。研究人員們選用了能夠讓原本的 GPT-2 模型輸出惡意文本的對(duì)抗性文本開(kāi)頭，在應(yīng)用 PPLM 后，繼續(xù)輸出對(duì)抗性文本的概率從原來(lái)的 63.6% 降低到了 4.6%。不過(guò)，不僅確保模型的輸出完全符合設(shè)計(jì)者的意圖還需要更多后續(xù)研究，我們也需要用更多方法避免惡意的使用者反倒利用 PPLM 的特點(diǎn)專門(mén)生成惡意文本。

總結(jié)

在這項(xiàng)研究中，Uber AI 的研究人員們提出了可以在使用過(guò)程中引導(dǎo)大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型輸出不同主題、不同風(fēng)格文本的 PPLM，而且可以靈活地搭配一個(gè)到多個(gè)詞袋模型、小型判別式模型等等作為屬性模型，在細(xì)粒度地控制生成文本內(nèi)容和風(fēng)格的同時(shí)，即保持了文本的合理和流暢，也避免了重新訓(xùn)練或者精細(xì)調(diào)節(jié)語(yǔ)言模型。PPLM 中的預(yù)訓(xùn)練語(yǔ)言模型可以使用各種自回歸語(yǔ)言模型，屬性模型也可以使用各種可微模型，這都意味著 PPLM 還有很大的使用空間。

閱讀論文：Plug and Play Language Models: a Simple Approach to Controlled Text Generation，https://arxiv.org/abs/1912.02164

代碼開(kāi)源：