丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
新鮮 正文
發(fā)私信給格林
發(fā)送

7

發(fā)表政治演講的,也可以是人工智能

本文作者: 格林 2016-01-20 18:13
導(dǎo)語(yǔ):政治演講大多千篇一律,它引導(dǎo)我們?nèi)ニ伎家粋€(gè)有趣的問(wèn)題:有沒(méi)有可能讓機(jī)器自動(dòng)撰寫(xiě)政治演講稿呢?

發(fā)表政治演講的,也可以是人工智能

不要問(wèn)國(guó)家為你做了什么,而要問(wèn)你為國(guó)家做了什么?

——肯尼迪(1961年)

上面這樣經(jīng)典的政治演講少之又少,普普通通的演講倒是很多,比如美國(guó)國(guó)會(huì)的辯論演講。這些演講大多千篇一律,都遵循標(biāo)準(zhǔn)的格式,重復(fù)相似的論調(diào),甚至使用一樣的短語(yǔ)來(lái)表述特定的政治立場(chǎng)和觀(guān)點(diǎn)??雌饋?lái)好像背后有一套算法在決定它的內(nèi)容。 

于是它引導(dǎo)我們?nèi)ニ伎家粋€(gè)有趣的問(wèn)題:有沒(méi)有可能讓機(jī)器自動(dòng)撰寫(xiě)政治演講稿呢?

美國(guó)馬薩諸塞大學(xué)研究人員Valentin Kassarnig為我們帶來(lái)了答案,他開(kāi)發(fā)了一套撰寫(xiě)政治演講稿的人工智能(AI)機(jī)器算法,機(jī)器寫(xiě)出的講稿幾乎可以以假亂真。

分析文本預(yù)測(cè)單詞

從表面上看,基本原理還是很簡(jiǎn)單的。Kassarnig首先建了一個(gè)數(shù)據(jù)庫(kù),從53場(chǎng)美國(guó)國(guó)會(huì)辯論中抽取4000個(gè)政治演講片斷,編成一套“機(jī)器學(xué)習(xí)”算法,讓它自動(dòng)撰寫(xiě)稿件。這些政治演講由5萬(wàn)多個(gè)句子組成,平均每個(gè)句子包涵23個(gè)單詞。凱斯塞寧將演講按政黨進(jìn)行分類(lèi),比如哪些是民主黨的,哪些是共和黨的,看它們是否贊同或者反對(duì)某個(gè)特定的主題。

魔鬼在于細(xì)節(jié),分析數(shù)據(jù)庫(kù)是最大的挑戰(zhàn)。在嘗試了許多種技術(shù)之后,Kassarnig最終采用了基于“N-grams(元語(yǔ)法模型即馬爾可夫模型)”的方法。他首先用詞類(lèi)法分析文本,也就是用語(yǔ)法規(guī)則來(lái)給每一個(gè)詞語(yǔ)和短語(yǔ)作標(biāo)志(標(biāo)為名詞、動(dòng)詞、形容詞等)。然后分析第6個(gè)詞或者短語(yǔ),根據(jù)前5個(gè)詞或者短語(yǔ)判斷第6個(gè)詞或者短語(yǔ)最有可能是什么。Kassarnig說(shuō):“只要看它前面是5個(gè)是什么,我們就可以很快確定所有的單詞?!?/p>

在分析詞的過(guò)程中演講稿會(huì)同步生成。Kassarnig需要告訴算法寫(xiě)什么類(lèi)型的演講稿,比如是給民主黨寫(xiě)還是給共和黨寫(xiě)。算法最開(kāi)始會(huì)按給定的類(lèi)別搜索6個(gè)詞或者短語(yǔ)組成的數(shù)據(jù)庫(kù),然后用5個(gè)詞或者短語(yǔ)作為起點(diǎn)來(lái)撰寫(xiě)演講稿。

算法的寫(xiě)作從隨機(jī)選擇的5個(gè)詞或者短語(yǔ)開(kāi)始,然后選擇可以與之相關(guān)聯(lián)的下一個(gè)單詞。Kassarnig說(shuō):“跟著系統(tǒng)就會(huì)自動(dòng)一個(gè)接一個(gè)地預(yù)測(cè)單詞,并最終預(yù)測(cè)演講的結(jié)尾?!?/p>

整個(gè)過(guò)程有一些技巧。例如,算法會(huì)知道演講中最可能出現(xiàn)的特定主題是什么,然后它會(huì)挑選其它主題嵌入到演講中去,它還要決定如何修飾這些主題。

機(jī)器的政治寫(xiě)作水平挺高

下面是機(jī)器寫(xiě)的一則民主黨講稿:

“議長(zhǎng)先生,多年來(lái),因?yàn)槭艿狡飘a(chǎn)法的保護(hù),誠(chéng)實(shí)而不幸的消費(fèi)者可以為自己的案子進(jìn)行申訴了,最終他們合理而有效地償還了債務(wù)。系統(tǒng)所采用的方法是管用的,破產(chǎn)法院會(huì)評(píng)估各種情況,如收入、資產(chǎn)、債務(wù),從而決定哪些債務(wù)應(yīng)該償還,決定消費(fèi)者如何自力更生。讓我們支持增長(zhǎng)和機(jī)會(huì),請(qǐng)通過(guò)這項(xiàng)立法?!?/p>

寫(xiě)出來(lái)的文稿還算通順,畢竟Kassarnig的人工智能算法還沒(méi)有接受過(guò)訓(xùn)練,它只是在最開(kāi)始時(shí)作了標(biāo)記,并對(duì)政治演講按6個(gè)詞組或者短語(yǔ)進(jìn)行過(guò)一番分析。他用一些標(biāo)準(zhǔn)對(duì)演講稿進(jìn)行評(píng)估,比如檢查語(yǔ)法正確性、句子過(guò)渡、講稿結(jié)構(gòu)和內(nèi)容,評(píng)估發(fā)現(xiàn)機(jī)器寫(xiě)的東西很不錯(cuò)。Kassarnig說(shuō):“特別值得欣慰的是講稿的語(yǔ)法很正確,句子過(guò)渡也非常流暢。”

盡管如此,讓機(jī)器算法走上政治舞臺(tái),Kassarnig并不樂(lè)觀(guān):“盡管算法的確可以為政治家撰寫(xiě)演講稿,但它的結(jié)果不太可能好?!痹敢馐褂眠@套算法的政客沒(méi)幾個(gè)。

幸好算法還可以用來(lái)撰寫(xiě)其它類(lèi)型的文本,比如新聞,只要根據(jù)同樣的事件給它們提供一些故事就可以了。它還可以用來(lái)寫(xiě)博客,只要為它準(zhǔn)備一個(gè)很大的數(shù)據(jù)庫(kù),在里面裝滿(mǎn)相似的文章就行了。 

凱斯塞寧希望大家都來(lái)試一試,他已經(jīng)將源代碼發(fā)布在GitHub上,快去試下吧。

via techreview

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)