0
本文作者: 我在思考中 | 2022-06-06 10:19 |
作者|李梅
編輯|陳彩嫻
后天就要高考了,各位是不是已經(jīng)開始緊張了(誤)?
雖然咱不參加高考,但每年還是會(huì)例行關(guān)注一波高考作文題。畢竟都是被虐過(guò)的人,依稀還記得那些年的「絲瓜藤和肉豆須」、「舉報(bào)我爹開車打電話」、「齊桓公、管仲和鮑叔」......
而高考前,除了老師和考生,吃瓜群眾也會(huì)積極投身于「語(yǔ)文作文押題」這一重大工程中。
最近就有一位B站UP主 @圖靈的貓 整出了新活,用AI預(yù)測(cè)出了今年高考最有可能出現(xiàn)的7大命題。
在視頻里,UP主分別展示了這7個(gè)命題的「核心詞」、「預(yù)測(cè)主題」和「模型表征」:
困難、希望
拼搏、自強(qiáng)
探索、夢(mèng)想
創(chuàng)新、發(fā)展
奮斗、價(jià)值
公平、德育
美、環(huán)境
怎么樣,是不是很有內(nèi)味兒?
那這個(gè)預(yù)測(cè)模型是如何工作的呢?據(jù)UP主介紹,與人工命題需要從大量熱點(diǎn)事件、政策文件中提取和篩選主題、進(jìn)行命題類似,AI也需要從大量數(shù)據(jù)中挖掘規(guī)律,獲取的數(shù)據(jù)越多、分布越合理,預(yù)測(cè)的準(zhǔn)確性也會(huì)越高。
為了獲取盡可能多的數(shù)據(jù),UP主專門寫了一套爬蟲,來(lái)爬取過(guò)去一年內(nèi)人民日?qǐng)?bào)、人民網(wǎng)、央視新聞等官媒所發(fā)表的文章、期刊和報(bào)紙,以及高層會(huì)議的重要文件和講話。
之后,通過(guò)自然語(yǔ)言處理中的預(yù)訓(xùn)練模型以及主題建模算法,這套AI系統(tǒng)可以理解中文語(yǔ)境下的新聞與文章,以此學(xué)習(xí)并模仿過(guò)去幾年的高考作文出題思路,結(jié)合過(guò)去一年中最為重要的事件脈絡(luò),提煉成最終的題目短語(yǔ)。
不過(guò),近年來(lái)的高考作文命題越來(lái)越向人生價(jià)值觀、家國(guó)情懷等「大格局」主題靠近,所以,類似于(以前的)江蘇卷和上海卷那樣思辨性強(qiáng)的作文題目,不在UP主的預(yù)測(cè)集范圍內(nèi)。
UP主已將這套算法的代碼開源在了Github上,傳送門:https://github.com/EssayKillerBrain/EssayTopicPredict
此視頻一出,引發(fā)了B站網(wǎng)友的大量討論??佳悬h、考公黨紛紛求預(yù)測(cè)考研英語(yǔ)作文題、考研政治題、公考國(guó)考題之類,這些題目與如今的高考作文命題的確有相似之處。當(dāng)然還有很多抱有正確金錢觀的人士(如本人)想要AI來(lái)預(yù)測(cè)彩票開獎(jiǎng)。
愛抖機(jī)靈的網(wǎng)友也已經(jīng)開始替命題組緊張了,不過(guò),也許命題組早已經(jīng)用了另一套算法來(lái)反預(yù)測(cè)呢。
還有人在基于這些預(yù)測(cè)結(jié)果對(duì)全國(guó)卷的作文展開更具體的預(yù)測(cè)。
至于預(yù)測(cè)結(jié)果的準(zhǔn)確性,還要等到兩天后見分曉,不過(guò)很多考生表示,在模擬考中他們的確已經(jīng)遇到這些預(yù)測(cè)出來(lái)的主題,也都在自己老師預(yù)測(cè)到的范圍內(nèi)。但從另一個(gè)角度看,這種預(yù)測(cè)結(jié)果似乎有點(diǎn)「聽君一席話,如聽一席話」了,這些核心詞和主題都是過(guò)去一年的熱點(diǎn),不用AI,我也能押...而命題組不按常理出牌也是常有的事,重點(diǎn)劃得太多,相當(dāng)于沒(méi)有重點(diǎn)。
也有網(wǎng)友懷疑預(yù)測(cè)結(jié)果是不是過(guò)擬合了,畢竟有些熱點(diǎn)事件在新聞中的存在感很強(qiáng),但與語(yǔ)文作文命題的關(guān)聯(lián)性也許并不大。
另外,對(duì)于幫助人類寫作文、批改作業(yè)、預(yù)測(cè)考題等AI產(chǎn)品,我們也要考慮用途正當(dāng)性的問(wèn)題。正如UP在視頻中所提到的,類似的AI模型一經(jīng)出現(xiàn),就會(huì)被很多嗅到商機(jī)的人利用去牟利,去二手交易平臺(tái)逛一逛就會(huì)發(fā)現(xiàn),已經(jīng)有很多人在賣各種「寫作神器」、「AI文章自動(dòng)生成器」之類的,而有些就是完全復(fù)制自這位UP主之前開發(fā)出的AI寫作文的模型,所以還存在知識(shí)產(chǎn)權(quán)難以得到保護(hù)的問(wèn)題。
對(duì)于我們大多數(shù)人來(lái)說(shuō),還是有用則用,無(wú)用就圖一樂(lè)吧~
最后,我們祝全國(guó)考生旗開得勝,金榜題名。
B站視頻鏈接:
https://www.bilibili.com/video/BV1j34y177Wz?spm_id_from=333.851.b_7265636f6d6d656e64.6
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。