丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給AI研習社
發(fā)送

0

當 AI 邂逅藝術:機器寫詩綜述

本文作者: AI研習社 編輯:賈智龍 2017-05-12 17:50
導語:用RNN寫詩,是什么效果?

引言

什么是藝術?
機器的作品能否叫藝術?
機器能否取代藝術家?

這些問題,相信不同的人,會有不同的答案。很多人認為機器生成的作品只是簡單的模仿人類,沒有創(chuàng)造性可言,但是人類藝術家,不也是從模仿和學習開始的嗎?本文是為 PaperWeekly 寫的一篇機器詩歌生成的綜述文章,希望能增進大家對這個領域的了解。

詩歌是人類文學皇冠上的明珠。我國自《詩經》以后,兩千年來的詩篇燦若繁星。讓機器自動生成詩歌,一直是人工智能領域一個有挑戰(zhàn)性的工作。

基于傳統(tǒng)方法的詩歌生成

機器詩歌生成的工作,始于 20 世紀 70 年代。傳統(tǒng)的詩歌生成方法,主要有以下幾種:

  • Word Salada(詞語沙拉):是最早期的詩歌生成模型,被稱作只是簡單將詞語進行隨機組合和堆砌而不考慮語義語法要求。

  • 基于模板和模式的方法:基于模板的方法類似于完形填空,將一首現(xiàn)有詩歌挖去一些詞,作為模板,再用一些其他詞進行替換,產生新的詩歌。這種方法生成的詩歌在語法上有所提升,但是靈活性太差。因此后來出現(xiàn)了基于模式的方法,通過對每個位置詞的詞性,韻律平仄進行限制,來進行詩歌生成。

  • 基于遺傳算法的方法:周昌樂等 [1] 提出并應用到宋詞生成上。這里將詩歌生成看成狀態(tài)空間搜索問題。先從隨機詩句開始,然后借助人工定義的詩句評估函數(shù),不斷進行評估,進化的迭代,最終得到詩歌。這種方法在單句上有較好的結果,但是句子之間缺乏語義連貫性。

  • 基于摘要生成的方法:嚴睿等 [2] 將詩歌生成看成給定寫作意圖的摘要生成問題,同時加入了詩歌相關的一些優(yōu)化約束。

  • 基于統(tǒng)計機器翻譯的方法:MSRA 的何晶和周明 [3] 將詩歌生成看成一個機器翻譯問題,將上一句看成源語言,下一句看成目標語言,用統(tǒng)計機器翻譯模型進行翻譯,并加上平仄押韻等約束,得到下一句。通過不斷重復這個過程,得到一首完整的詩歌。

基于深度學習技術的詩歌生成

傳統(tǒng)方法非常依賴于詩詞領域的專業(yè)知識,需要專家設計大量的人工規(guī)則,對生成詩詞的格律和質量進行約束。同時遷移能力也比較差,難以直接應用到其他文體(唐詩,宋詞等)和語言(英文,日文等)。隨著深度學習技術的發(fā)展,詩歌生成的研究進入了一個新的階段。

RNNLM

基于 RNN 語言模型 [4] 的方法,將詩歌的整體內容,作為訓練語料送給 RNN 語言模型進行訓練。訓練完成后,先給定一些初始內容,然后就可以按照語言模型輸出的概率分布進行采樣得到下一個詞,不斷重復這個過程就產生完整的詩歌。Karpathy 有一篇文章,非常詳細的介紹這個:The Unreasonable Effectiveness of Recurrent Neural Networks

Chinese Poetry Generation with Recurrent Neural Networks

RNNPG 模型 [5],首先由用戶給定的關鍵詞生成第一句,然后由第一句話生成第二句話,由一,二句話生成第三句話,重復這個過程,直到詩歌生成完成。模型的模型由三部分組成:

  • Convolutional Sentence Model(CSM):CNN 模型,用于獲取一句話的向量表示。

  • Recurrent Context Model (RCM):句子級別的 RNN,根據(jù)歷史生成句子的向量,輸出下一個要生成句子的 Context 向量。

  • Recurrent Generation Model (RGM):字符級別 RNN,根據(jù) RCM 輸出的 Context 向量和該句之前已經生成的字符,輸出下一個字符的概率分布。解碼的時候根據(jù) RGM 模型輸出的概率和語言模型概率加權以后,生成下一句詩歌,由人工規(guī)則保證押韻。

模型結構如下圖:

當 AI 邂逅藝術:機器寫詩綜述

模型生成例子如下圖:

當 AI 邂逅藝術:機器寫詩綜述

Chinese Song Iambics Generation with Neural Attention-based Model

模型 [6] 是基于 attention 的 encoder-decoder 框架,將歷史已經生成的內容作為源語言,將下一句話作為目標語言進行翻譯。需要用戶提供第一句話,然后由第一句生成第二句,第一,二句生成第三句,并不斷重復這個過程,直到生成完整詩歌。
基于 Attention 機制配合 LSTM,可以學習更長的詩歌,同時在一定程度上,可以保證前后語義的連貫性。

模型結構如下圖:

當 AI 邂逅藝術:機器寫詩綜述

模型生成例子如下圖:

當 AI 邂逅藝術:機器寫詩綜述

Chinese Poetry Generation with Planning based Neural Network

模型 [8] 不需要專家知識,是一個端到端的模型。它試圖模仿人類開始寫作前,先規(guī)劃一個寫作大綱的過程。整個詩歌生成框架由兩部分組成:規(guī)劃模型和生成模型。

規(guī)劃模型:將代表用戶寫作意圖的 Query 作為輸入,生成一個寫作大綱。寫作大綱是一個由主題詞組成的序列,第 i 個主題詞代表第 i 句的主題。

生成模型:基于 encoder-decoder 框架。有兩個 encoder, 其中一個 encoder 將主題詞作為輸入,另外一個 encoder 將歷史生成的句子拼在一起作為輸入,由 decoder 生成下一句話。decoder 生成的時候,利用 Attention 機制,對主題詞和歷史生成內容的向量一起做打分,由模型來決定生成的過程中各部分的重要性。

前面介紹的幾個模型,用戶的寫作意圖,基本只能反映在第一句,隨著生成過程往后進行,后面句子和用戶寫作意圖的關系越來越弱,就有可能發(fā)生主題漂移問題。而規(guī)劃模型可以使用戶的寫作意圖直接影響整首詩的生成,因此在一定程度上,避免了主題漂移問題,使整首詩的邏輯語義更為連貫。

總體框架圖如下:

當 AI 邂逅藝術:機器寫詩綜述

生成模型框架圖如下:

當 AI 邂逅藝術:機器寫詩綜述

詩歌圖靈測試:給定一個題目,讓機器和人分別做一首詩 ,由人來區(qū)分哪首詩是人寫的。實驗結果也很有意思,對普通人來說,已經無法區(qū)分詩是由機器生成的還是人生成的,下面是一組測試的例子:

當 AI 邂逅藝術:機器寫詩綜述

現(xiàn)代概念詩歌生成例子:

當 AI 邂逅藝術:機器寫詩綜述

i, Poet: Automatic Poetry Composition through Recurrent Neural Networks with Iterative Polishing Schema

模型 [7] 基于 encoder-decoder 框架。encoder 階段,用戶提供一個 Query 作為自己的寫作意圖, 由 CNN 模型獲取 Query 的向量表示。decoder 階段,使用了 hierarchical 的 RNN 生成框架,由句子級別和詞級別兩個 RNN 組成。

句子級別 RNN:輸入句子向量表示,輸出下一個句子的 Context 向量。

字符級別 RNN:輸入 Context 向量和歷史生成字符,輸出下一個字符的概率分布。當一句生成結束的時候,字符級別 RNN 的最后一個向量,作為表示這個句子的向量,送給句子級別 RNN。

這篇文章一個比較有意思的地方,是想模擬人類寫詩反復修改的過程,加入了打磨機制。反復迭代來提高詩歌生成質量。

總體框架圖如下:

當 AI 邂逅藝術:機器寫詩綜述

Generating Topical Poetry

模型 [9] 基于 encoder-decoder 框架,分為兩步。先根據(jù)用戶輸入的關鍵詞得到每句話的最后一個詞,這些詞都押韻且與用戶輸入相關。再將這些押韻詞作為一個序列,送給 encoder, 由 decoder 生成整個詩歌。這種機制一方面保證了押韻,另外一方面,和之前提到的規(guī)劃模型類似,在一定程度上避免了主題漂移問題。

模型框架圖如下:

當 AI 邂逅藝術:機器寫詩綜述

生成例子如下:

當 AI 邂逅藝術:機器寫詩綜述

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

模型 [10] 將圖像中的對抗生成網絡,用到文本生成上。生成網絡是一個 RNN,直接生成整首詩歌。而判別網絡是一個 CNN。用于判斷這首詩歌是人寫的,還是機器生成的,并通過強化學習的方式,將梯度回傳給生成網絡。
模型框架圖如下:

當 AI 邂逅藝術:機器寫詩綜述

總結

從傳統(tǒng)方法到深度學習,詩歌生成技術有了很大發(fā)展,甚至在一定程度上,已經可以產生普通人真假難辨的詩歌。但是目前詩歌生成技術,學習到的仍然只是知識的概率分布,即詩句內,詩句間的搭配規(guī)律。而沒有學到詩歌蘊含思想感情。因此盡管生成的詩歌看起來有模有樣,但是仍然感覺只是徒有其表,缺乏一絲人的靈性。
另外一方面,詩歌不像機器翻譯有 BLEU 作為評價指標,目前仍然依賴人工的主觀評價,缺乏可靠的自動評估方法,因此模型優(yōu)化的目標函數(shù)和主觀的詩歌評價指標之間,存在較大的 gap,也影響了詩歌生成質量的提高。在圍棋博弈上,以 AlphaGo 為代表的機器已經超過了人類頂尖選手,但是在詩歌生成上,離人類頂尖詩人水平,尚有很長的路要走。

參考文獻

[1] 一種宋詞自動生成的遺傳算法及其機器實現(xiàn)
[2] i,Poet: Automatic Chinese Poetry Composition through a Generative Summarization Framework under Constrained Optimization
[3] Generating Chinese Classical Poems with Statistical Machine Translation Models
[4] Recurrent neural network based language model
[5] Chinese Poetry Generation with Recurrent Neural Networks
[6] Chinese Song Iambics Generation with Neural Attention-based Model
[7] i, Poet: Automatic Poetry Composition through Recurrent Neural Networks with Iterative Polishing Schema
[8] Chinese Poetry Generation with Planning based Neural Network
[9] Generating Topical Poetry
[10] SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

雷鋒網按:本文原作者蕭瑟,原載于作者的知乎專欄。


深度學習之神經網絡特訓班

20年清華大學神經網絡授課導師鄧志東教授,帶你系統(tǒng)學習人工智能之神經網絡理論及應用!

課程鏈接:http://www.mooc.ai/course/65

加入AI慕課學院人工智能學習交流QQ群:624413030,與AI同行一起交流成長


雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。

當 AI 邂逅藝術:機器寫詩綜述

分享:
相關文章

編輯

聚焦數(shù)據(jù)科學,連接 AI 開發(fā)者。更多精彩內容,請訪問:yanxishe.com
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說