丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
AI+ 正文
發(fā)私信給李詩(shī)
發(fā)送

0

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

本文作者: 李詩(shī) 2017-07-10 14:59 專題:GAIR 2017
導(dǎo)語(yǔ):雷鋒網(wǎng)按:在CCF-GAIR上,北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所研究員萬(wàn)小軍做了《機(jī)器寫(xiě)稿的技術(shù)與應(yīng)用》的演講報(bào)告,指出寫(xiě)稿機(jī)器人用了哪些技術(shù),能實(shí)現(xiàn)哪些功能。


 人工智能的發(fā)展將會(huì)取代人類的哪些工作一直都是備受關(guān)注的話題,而我們一直都認(rèn)為人的思考能力是我們最后的堡壘。正如帕斯卡爾所說(shuō), “人只不過(guò)是一根會(huì)思考的蘆葦”,我們是自然界最脆弱的生物,卻因?yàn)樗伎甲兊脽o(wú)比強(qiáng)大。

演講、寫(xiě)作是我們思考能力的直接表現(xiàn),赫拉利在《人類簡(jiǎn)史》中說(shuō)道,講故事的能力讓智人種變得和其他原始人和動(dòng)物不一樣。要是機(jī)器也能表達(dá),也能寫(xiě)作也能講故事來(lái)創(chuàng)造自己的文化,人何以與之對(duì)抗呢?

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

在由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦、雷鋒網(wǎng)與香港中文大學(xué)(深圳)全程承辦的AI盛會(huì)「全球人工智能與機(jī)器人峰會(huì)」的AI+分會(huì)場(chǎng)上,北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所研究員萬(wàn)小軍做了《機(jī)器寫(xiě)稿的技術(shù)與應(yīng)用》的演講報(bào)告。以下內(nèi)容由雷鋒網(wǎng)整理自萬(wàn)小軍在會(huì)上的演講實(shí)錄。

機(jī)器寫(xiě)稿背景與現(xiàn)狀

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

早在幾年前,國(guó)外就已經(jīng)有機(jī)器人寫(xiě)稿,最具代表性的是來(lái)自美國(guó)、歐洲的三家公司:ARRIA、AI、NARRATIVE SCIENCE。據(jù)說(shuō)他們的機(jī)器人采用英語(yǔ)或者西方語(yǔ)言為著名的媒體網(wǎng)站寫(xiě)了數(shù)千萬(wàn)篇稿件。

國(guó)內(nèi)的寫(xiě)稿機(jī)器人在這幾年才開(kāi)始慢慢受到大家的關(guān)注。有很多的媒體單位在和一些學(xué)術(shù)機(jī)構(gòu)進(jìn)行合作,推出寫(xiě)稿機(jī)器人。另外微軟、百度、騰訊、今日頭條這樣互聯(lián)網(wǎng)巨頭也在研發(fā)機(jī)器寫(xiě)稿技術(shù),因?yàn)樗约盒枰鲆恍﹥?nèi)容的創(chuàng)作。主要是側(cè)重在體育、財(cái)經(jīng)、民生領(lǐng)域,一般政治類的涉及的比較少。涉及到政治稿件如果犯錯(cuò)的話,問(wèn)題就比較大,所以主要還是在一些不太容易出問(wèn)題的領(lǐng)域?qū)懜濉?/p>

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

機(jī)器人寫(xiě)稿的模式與技術(shù)

機(jī)器寫(xiě)稿有兩種方式,一種是原創(chuàng),一種是二次創(chuàng)作。原創(chuàng)一般是之前沒(méi)有稿件,只有結(jié)構(gòu)化的數(shù)據(jù),我們可以借助結(jié)構(gòu)化的數(shù)據(jù)去生成新的稿件。比如說(shuō)我們寫(xiě)一個(gè)天氣預(yù)報(bào)的報(bào)道,或者寫(xiě)一個(gè)年報(bào)、財(cái)報(bào)都直接可以從數(shù)據(jù)中生成。而關(guān)于一個(gè)已經(jīng)有相關(guān)報(bào)道的事件,我們借助這些報(bào)道進(jìn)行一些拼湊、改寫(xiě)成為新的稿件,這就是二次創(chuàng)作。還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

原創(chuàng)和二次創(chuàng)作所依賴的技術(shù)也是不太一樣的。原創(chuàng)采用的是自然語(yǔ)言生成技術(shù),是從結(jié)構(gòu)化數(shù)據(jù)/意義表達(dá)生成自然語(yǔ)言語(yǔ)句。二次創(chuàng)作采用的是自動(dòng)摘要技術(shù),我們從已有的文字素材去給它摘要,把它生成一個(gè)新的稿件。這是兩類非常關(guān)鍵的技術(shù)。

還有其它的一些相關(guān)技術(shù):文本信息推薦技術(shù)和文本復(fù)述技術(shù)。比如說(shuō)我們?cè)趯?xiě)一個(gè)稿件的時(shí)候,有時(shí)候會(huì)想引用一句名人的話或者引用一個(gè)唐詩(shī)宋詞,機(jī)器會(huì)自動(dòng)給你推薦。第二個(gè)是文本復(fù)述技術(shù),我們基于一個(gè)個(gè)稿件做創(chuàng)作的時(shí)候,如果我們直接把原文原始的內(nèi)容拷貝過(guò)來(lái),這個(gè)有點(diǎn)抄襲的嫌疑。所以這時(shí)候我們就需要做一些復(fù)述,會(huì)用不同的語(yǔ)言去表達(dá)同樣的語(yǔ)義。這里有一個(gè)例子是說(shuō)“梅西獲得了5座金球獎(jiǎng)”,你可以改為“梅西是五屆金球獎(jiǎng)得主”,也可以改寫(xiě)為“金球獎(jiǎng)5次頒給了梅西”,這樣就可以避免版權(quán)的問(wèn)題,也可以讓我們的改寫(xiě)更加生動(dòng)。

機(jī)器人寫(xiě)稿應(yīng)用廣泛

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

機(jī)器人寫(xiě)稿的應(yīng)用十分廣泛。首先是新聞資訊的自動(dòng)生成。我們輸入結(jié)構(gòu)化的數(shù)據(jù),以及已經(jīng)有的稿件,可以生成長(zhǎng)度可控的幾十個(gè)字到幾千字的稿件。例如,一個(gè)體育的簡(jiǎn)訊的生成需要我們從網(wǎng)上抓取關(guān)于體育賽事的一些基本的數(shù)據(jù),借助這個(gè)數(shù)據(jù)做一些數(shù)據(jù)分析,文檔規(guī)劃、語(yǔ)句的實(shí)現(xiàn),就可以生成右邊的這樣一個(gè)比較簡(jiǎn)單的體育的賽事報(bào)道。

 還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

另一個(gè)是體育賽事的長(zhǎng)篇報(bào)道的自動(dòng)生成。簡(jiǎn)訊包含的信息量很少,我們想生成一個(gè)長(zhǎng)篇的報(bào)道來(lái)介紹整個(gè)比賽的過(guò)程。我們經(jīng)常發(fā)現(xiàn)著名的體育比賽下面都有文字直播,通常包含主持人對(duì)這樣一個(gè)比賽的精彩細(xì)節(jié)的描述,我們通過(guò)機(jī)器學(xué)習(xí)的手段,能夠把這些精彩的描述挑選出來(lái),放到我們最終的報(bào)道中,這個(gè)報(bào)道就寫(xiě)得比較長(zhǎng),可以達(dá)到上千字以上。首先借助機(jī)器學(xué)習(xí)的手段,對(duì)直播文字進(jìn)行語(yǔ)句的智能排序,再進(jìn)行智能選擇,最后生成一個(gè)平均長(zhǎng)度超過(guò)1000字的賽事的報(bào)道。我們看到直播文字一般會(huì)達(dá)到數(shù)千字,一般是5000字以上,所以要從5000字中選擇和拼湊出1000字以上的長(zhǎng)篇報(bào)道。

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

還有一個(gè)是娛樂(lè)新聞的自動(dòng)生成,娛樂(lè)新聞?dòng)泻芏嗖煌纳煞绞?。比如說(shuō)你可以根據(jù)明星的數(shù)據(jù)庫(kù),直接對(duì)這個(gè)明星做一個(gè)簡(jiǎn)單的描述。我們做的是可以借助明星的微博生成娛樂(lè)新聞。明星通常會(huì)發(fā)一些微博,有些微博會(huì)吸引大家的眼球,構(gòu)成熱新聞。我們有一個(gè)機(jī)器學(xué)習(xí)的手段,能自動(dòng)判別明星發(fā)的哪一條微博具有新聞價(jià)值,再判斷這個(gè)微博下面的哪些評(píng)論,具有新聞價(jià)值。把這個(gè)微博和它的評(píng)論以及相關(guān)的背景信息組合在一塊,就可以形成一個(gè)比較短的新聞。

 還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

我們也做了新聞綜述的自動(dòng)生成的嘗試。我們對(duì)于某一個(gè)事件已經(jīng)有比較多的新聞報(bào)道,需要思考怎樣基于這些報(bào)道去自動(dòng)生成一個(gè)篇幅較長(zhǎng)的事件的綜述。我們所使用的對(duì)象是用Wikinews,它的內(nèi)容基本都是比較客觀、比較中立的綜述。它會(huì)對(duì)已有的報(bào)道做一些分析,做一些無(wú)偏袒的綜合,然后得到一篇長(zhǎng)的綜述。我們拿這樣的數(shù)據(jù)做了一個(gè)實(shí)驗(yàn),去做一些語(yǔ)句的篩選和組合。因?yàn)橐獦?gòu)成一個(gè)綜述,所以不是以句子為單位,而是以一個(gè)子話題為單位。我們首先劃分子話題,每個(gè)話題對(duì)應(yīng)一個(gè)段落。然后對(duì)它進(jìn)行一個(gè)重要性的排序,最后做一個(gè)段落的選擇,也就是子話題的選擇并且把相關(guān)的子話題合并,得到一個(gè)更完備的子話題最終形成完整的事件的綜述。

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

除了生成事實(shí)型的新聞之外,我們也嘗試讓機(jī)器人去生成用戶的評(píng)論。我們輸入對(duì)于產(chǎn)品的某一個(gè)特征或者某幾個(gè)特征上的評(píng)分,比如我輸入給這個(gè)軟件的是我對(duì)這個(gè)汽車的操控性是5分評(píng)價(jià),對(duì)它的外觀是3分評(píng)價(jià),根據(jù)這個(gè)評(píng)價(jià)會(huì)自動(dòng)生成一個(gè)自然語(yǔ)言的評(píng)論。我們采用的是一個(gè)深度學(xué)習(xí)的模型,右邊是這樣一個(gè)模型的架構(gòu)。我們提前可以看我們最終生成的這樣一個(gè)例子。

這個(gè)汽車有空間、動(dòng)力、控制等等一系列的特征,用戶要做的就是針對(duì)每個(gè)特征輸入一個(gè)分?jǐn)?shù)值,這個(gè)分?jǐn)?shù)值越高代表你越滿意,分?jǐn)?shù)值越低就越不滿意。我們看到這個(gè)例子,比如我們輸入的空間是3分,動(dòng)力是4分,舒適性是3分,3分代表一般,我們看到右側(cè)生成的中文的評(píng)論,得到的表達(dá)是“舒適性一般,畢竟是運(yùn)動(dòng)型的車”,它很準(zhǔn)確的對(duì)這個(gè)分?jǐn)?shù)進(jìn)行了描述。然后把舒適性從3分改成5分,5分是非常滿意,最終生成的對(duì)應(yīng)的文字的部分就是“舒適性很好,座椅的包裹性很好,坐著很舒服”。我們的模型能夠很好將這個(gè)分?jǐn)?shù)的細(xì)微改動(dòng)直接反應(yīng)到最終的自然語(yǔ)言的結(jié)果上。能夠根據(jù)用戶對(duì)我們的產(chǎn)品的特征的分?jǐn)?shù)的輸入,自動(dòng)生成一個(gè)比較完整的一大段的用戶的評(píng)論。這是基于深度學(xué)習(xí)模型來(lái)做的。

寫(xiě)稿機(jī)器人小明小南和阿同

我們目前有三個(gè)合作的機(jī)器人寫(xiě)稿項(xiàng)目,一個(gè)是今日頭條的“Xiaomingbot”小明機(jī)器人,南方都市報(bào)的“小南”,廣州日?qǐng)?bào)的“阿同”機(jī)器人。小明主要服務(wù)于奧運(yùn)會(huì),小南、阿同當(dāng)時(shí)是給2017年的全國(guó)兩會(huì)做了一些報(bào)道的工作。

跟今日頭條合作推出的小明寫(xiě)稿機(jī)器人,主要是針對(duì)體育賽事進(jìn)行賽事的簡(jiǎn)訊和長(zhǎng)篇報(bào)道的生成,既可以生成幾十字的短訊,又可以生成上千字的長(zhǎng)篇報(bào)道,它包括足球聯(lián)賽,也包括NBA的比賽,在奧運(yùn)會(huì)期間寫(xiě)了456篇,單篇最高的閱讀量是11萬(wàn)次。到上個(gè)月底,共撰寫(xiě)新聞5000多篇,總計(jì)閱讀量1800萬(wàn)次,這是因?yàn)榻袢疹^條的用戶量很多,所以閱讀量也是很多的。

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

這是Xiaomingbot頭條號(hào)的界面。這個(gè)歐冠決賽,尤文圖斯以1:4完敗皇家馬德里的比賽的結(jié)果的新聞是完全靠機(jī)器寫(xiě)出來(lái)的,這個(gè)稿件的文字很長(zhǎng),有1121個(gè)漢字,它比較準(zhǔn)確地把這個(gè)比賽的主要信息都做了一個(gè)描述,還是比較完整的一篇新聞報(bào)道。

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017小南寫(xiě)稿機(jī)器人現(xiàn)在是在南方都市報(bào)的APP上撰寫(xiě)一些民生新聞,去年年底做過(guò)春運(yùn)火車票的新聞撰寫(xiě),側(cè)重廣州到其它大城市的新聞,最近寫(xiě)的是天氣預(yù)報(bào)的新聞,在兩會(huì)期間還寫(xiě)過(guò)兩會(huì)的小南讀報(bào)的新聞。

小南寫(xiě)的春運(yùn)火車票的新聞中采用了不少賣萌的句子。當(dāng)然這也是把我們的新聞?dòng)浾叩恼Z(yǔ)言表達(dá)做了很好的總結(jié),最后使我們的機(jī)器人也能這樣表達(dá)出來(lái)。 最近小南機(jī)器人也做了一些天氣預(yù)報(bào)的寫(xiě)作。小南讀報(bào)主要是在兩會(huì)期間統(tǒng)計(jì)南方都市報(bào)跟兩會(huì)相關(guān)報(bào)道都分別屬于哪些領(lǐng)域,做了一個(gè)統(tǒng)計(jì)和盤(pán)點(diǎn),然后把這個(gè)盤(pán)點(diǎn)的結(jié)果用自然語(yǔ)言的形式表達(dá)出來(lái)。另外對(duì)其中一些爆款的新聞做了摘要和總結(jié),也放在這個(gè)稿件中,所以這個(gè)稿件的信息量是比較豐富的,對(duì)多篇新聞進(jìn)行了盤(pán)點(diǎn)。

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

阿同主要是在兩會(huì)期間做了一些工作,主要是對(duì)政府的工作報(bào)告做一些熱詞和關(guān)鍵數(shù)據(jù)的解讀,解讀完了之后進(jìn)行自然語(yǔ)言的表達(dá)。這是阿同對(duì)政協(xié)工作報(bào)告做一個(gè)熱詞的分析,今年的政協(xié)工作報(bào)告有哪些熱詞,這些熱詞跟去年相比有哪些變化,把這個(gè)變化的情況用自然語(yǔ)言表述,最終形成在報(bào)紙上印出來(lái)的報(bào)道。因?yàn)閺V州日?qǐng)?bào)要在報(bào)紙上印出來(lái),所以對(duì)錯(cuò)誤是零容忍,所以必須經(jīng)過(guò)人工的審核。

傳統(tǒng)媒體VS新媒體

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

對(duì)于不同的應(yīng)用單位,對(duì)稿件的質(zhì)量要求是不一樣的,對(duì)于一些傳統(tǒng)的媒體單位,它對(duì)稿件的錯(cuò)誤是零容忍。要發(fā)布到報(bào)紙上需要通過(guò)人工的審核,而一些自媒體可能就直接發(fā)在網(wǎng)上,個(gè)別的錯(cuò)別字或者個(gè)別的語(yǔ)句不通順不影響網(wǎng)友的閱讀,網(wǎng)友可能在下面寫(xiě)一個(gè)評(píng)論,說(shuō)這個(gè)稿件怎么還有錯(cuò)別字,但是這個(gè)也不影響網(wǎng)友的閱讀和點(diǎn)擊。所以自媒體對(duì)稿件的質(zhì)量容忍度比較高一點(diǎn)。所在兩種不同的場(chǎng)合下應(yīng)用的要求是不太一樣的,所以我們?cè)跈C(jī)器寫(xiě)稿發(fā)稿的時(shí)候也會(huì)有所不同。

 機(jī)器人VS記者

還有什么是寫(xiě)稿機(jī)器人不會(huì)寫(xiě)的?北大計(jì)算機(jī)所萬(wàn)小軍詳解寫(xiě)稿機(jī)器人的技術(shù)及應(yīng)用| CCF-GAIR 2017

目前為止,機(jī)器人跟記者之間的關(guān)系是一種分工協(xié)作的關(guān)系。機(jī)器人現(xiàn)在不具有邏輯思維的能力,也不具有深度總結(jié)的能力,它只能去把一個(gè)基本的新聞事實(shí)描述清楚,但是我們記者就可以寫(xiě)深度報(bào)道,比如說(shuō)中國(guó)足球,他可以經(jīng)過(guò)自己的分析,寫(xiě)中國(guó)足球這幾十年來(lái)落后的原因,它可以總結(jié)出幾條觀點(diǎn),但是機(jī)器人總結(jié)就很難了,所以我們的記者應(yīng)該是從事有創(chuàng)造性的、高智商的稿件的創(chuàng)作,而把一些重復(fù)的、低層次的稿件創(chuàng)作的活動(dòng)交給機(jī)器人完成,所以是一種分工協(xié)作的關(guān)系。

另外一個(gè)不同點(diǎn)就是,記者在寫(xiě)一個(gè)稿件的時(shí)候,他是很清楚地知道我在寫(xiě)什么,他知道自己要表達(dá)的語(yǔ)義。但實(shí)際上機(jī)器人在寫(xiě)這個(gè)稿件的時(shí)候,雖然他把每一個(gè)句子都寫(xiě)出來(lái)了,但實(shí)際上他不知道自己要寫(xiě)什么,這是最大的一個(gè)不同,就是說(shuō)它沒(méi)有理解自己的稿件,雖然它寫(xiě)出來(lái)了,包括機(jī)器人寫(xiě)詩(shī),或者寫(xiě)各種歌詞的時(shí)候,它也把那個(gè)語(yǔ)言寫(xiě)出來(lái)了,但是它并沒(méi)有真正理解那個(gè)語(yǔ)言,所以這是一個(gè)比較大的不同。

未來(lái)展望 

最后是一個(gè)未來(lái)的展望。我們看到現(xiàn)在機(jī)器寫(xiě)稿不光是在媒體行業(yè),我們現(xiàn)在也在跟一些游戲行業(yè)和情報(bào)行業(yè)合作,他們也有機(jī)器寫(xiě)稿的需求,只要什么時(shí)候你需要寫(xiě)這樣一些報(bào)告,比如寫(xiě)一些行業(yè)報(bào)告,或者寫(xiě)一些稿件,都可能會(huì)利用到機(jī)器寫(xiě)稿的技術(shù),不光是媒體行業(yè)寫(xiě)新聞會(huì)用到,其它的行業(yè)也會(huì)用到。

 第二個(gè)方向,我們現(xiàn)在寫(xiě)的稿件還主要側(cè)重對(duì)客觀事實(shí)的描寫(xiě),還沒(méi)有加入太多的態(tài)度和立場(chǎng),因此顯得人性化方面不太理想,下一步會(huì)讓我們的稿件自己具有一定的立場(chǎng),比如我們?cè)趫?bào)道中國(guó)隊(duì)對(duì)韓國(guó)隊(duì)的比賽的時(shí)候,我們?nèi)绻驹陧n國(guó)隊(duì)的立場(chǎng),如果中國(guó)隊(duì)輸了的話,我們就應(yīng)該是很高興的,標(biāo)題可能會(huì)說(shuō)“韓國(guó)隊(duì)大勝中國(guó)隊(duì)”,如果是站在中國(guó)隊(duì)的立場(chǎng),可能標(biāo)題寫(xiě)會(huì)“中國(guó)隊(duì)憾負(fù)韓國(guó)隊(duì)”,這個(gè)立場(chǎng)就不一樣,我們的稿件具有這樣的態(tài)度和立場(chǎng),它就會(huì)更加人性化。

第三點(diǎn)也是最難的一點(diǎn),就是讓機(jī)器學(xué)會(huì)推理和歸納,寫(xiě)出真正的深度報(bào)道。比如說(shuō)我們報(bào)道一場(chǎng)足球比賽以后,我們要分析一下為什么是這樣的結(jié)果,把這個(gè)原因進(jìn)行推理總結(jié)出來(lái)。這樣的報(bào)道就是真正的智能的,像之前寫(xiě)的稿件是一個(gè)弱人工智能時(shí)代,如果我們要寫(xiě)一個(gè)強(qiáng)人工智能的稿件,就必須讓機(jī)器具有這樣的態(tài)度和立場(chǎng),也具有這樣的推理、歸納能力,這是下一步要研究的目標(biāo),也是有可能去實(shí)現(xiàn)的一些目標(biāo)。尤其是具有態(tài)度和立場(chǎng),我覺(jué)得應(yīng)該在未來(lái)兩三年是可以去實(shí)現(xiàn)的。然后推理跟歸納,可能兩三年的時(shí)間都不一定夠,我覺(jué)得需要更長(zhǎng)的時(shí)間才有可能取得一些突破。

(萬(wàn)小軍老師的演講很細(xì)膩精彩,會(huì)后雷鋒網(wǎng)對(duì)萬(wàn)小軍老師進(jìn)行了專訪,更多關(guān)于寫(xiě)稿機(jī)器人的問(wèn)題的探討請(qǐng)點(diǎn)擊:《專訪北大計(jì)算機(jī)所萬(wàn)小軍:寫(xiě)稿機(jī)器人是新媒體時(shí)代的產(chǎn)物| CCF-GAIR 2017》)


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

關(guān)注AI業(yè)界、NLP、VR、AR技術(shù)與產(chǎn)品。采訪報(bào)道、行業(yè)交流請(qǐng)加微信“Hanass”
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)