5
一名來自斯坦福大學的學生Andrej Karpathy,發(fā)布了一項叫Lua的代碼,它能模仿人類語言。Karpathy的項目頁面中已經有一些點子和例子,而真正需要采樣的是能用來建立復發(fā)性神經網絡(RNN)的材料,也就是人類語言的材料。
最近,藝術家兼新媒體人Samim做了一項測試,證明用該算法可以很好地模仿奧巴馬演講。奧巴馬的RNN是基于一項Lua代碼,首先,Samim建立了一個網絡爬蟲來收集奧巴馬所有的公共演講,并對訪談和辯論內容進行分析,所有的這一切都被送入Karpathy的RNN模型中,然后用一小段話作引子(被稱為種子),算法就能生成一段演講。
奧巴馬的演講并不少,像“希望”和“Yes we can”都是很熟悉的主題了。自2007年以來,奧巴馬的演講稿撰稿人已經寫了730895字的文本,然而這還不包括采訪和辯論。
算法生成的奧巴馬語錄如下:
種子:反恐戰(zhàn)爭
大家好,非常感謝,上帝保佑美國。我們已經開始在全世界收集醫(yī)療保險信息。我們辛勤付出卻得不到發(fā)展。
種子:中國
非常感謝你,請大家坐下;非常感謝你;你們很友善;謝謝。
種子:工作
下午好,上帝保佑;國家增加預算來面對全新的挑戰(zhàn)——事實是由我們自己產生的。
從中可以看出,算法的表現并不令人樂觀。“最搞笑的是奧巴馬的RNN真的很喜歡禮貌地說:下午好,美好的一天,上帝保佑你,上帝保佑美國,謝謝。”Samim說道,不過他還沒有完全完成實驗。
不過總統(tǒng)的演講往往確實包含不少套話,這也難怪算法會學到這一手。而且我們已經有了能寫新聞稿和欣賞攝影作品的機器人了,說不定總統(tǒng)的演講稿真的可以用算法來寫。
via mb
關注腦洞微信號(hackmind),帶你領略更多前沿技術
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。