首戰(zhàn)告捷！網(wǎng)易有道斬獲首屆NLPCC中文語(yǔ)法錯(cuò)誤修正比賽冠軍

本文作者：黃善清

2018-08-31 16:16

導(dǎo)語(yǔ)：在今年首增的“中文語(yǔ)法錯(cuò)誤修正”共享任務(wù)比賽中，網(wǎng)易有道AI團(tuán)隊(duì)以召回率第一、綜合評(píng)價(jià)指標(biāo)第一的絕對(duì)優(yōu)勢(shì)拿下了冠軍。

網(wǎng)易有道AI團(tuán)隊(duì)

AI影響因子

比賽

比賽名稱：NLPCC中文語(yǔ)法錯(cuò)誤修正比賽

年份：2018

企業(yè)：網(wǎng)易

操作：競(jìng)賽

名次：1

雷鋒網(wǎng)AI科技評(píng)論按：CCF 自然語(yǔ)言處理與中文計(jì)算國(guó)際會(huì)議 (NLPCC) 是由中國(guó)計(jì)算機(jī)學(xué)會(huì)主辦的中文信息技術(shù)專業(yè)委員會(huì)年度學(xué)術(shù)會(huì)議，是專注于自然語(yǔ)言處理及中文計(jì)算領(lǐng)域的國(guó)際會(huì)議。在今年首增的「中文語(yǔ)法錯(cuò)誤修正」共享任務(wù)比賽中，網(wǎng)易有道AI團(tuán)隊(duì)以召回率第一、綜合評(píng)價(jià)指標(biāo)第一的絕對(duì)優(yōu)勢(shì)拿下了冠軍。以上事件在雷鋒網(wǎng)旗下學(xué)術(shù)頻道 AI 科技評(píng)論數(shù)據(jù)庫(kù)產(chǎn)品「AI 影響因子」中有相應(yīng)加分。

本次比賽中，主辦方提供的測(cè)試集是北京外國(guó)語(yǔ)大學(xué)的外籍學(xué)生撰寫的中文作文；訓(xùn)練集則采集自外國(guó)人學(xué)習(xí)中文的網(wǎng)站，包括非母語(yǔ)人士撰寫的中文文本和母語(yǔ)者的注釋和修正。

比賽伊始，需要由參賽者開發(fā)能自動(dòng)檢測(cè)、糾正CSL編寫者錯(cuò)誤的人工智能算法模型，利用訓(xùn)練集提高算法模型對(duì)相關(guān)問題的熟悉程度和修正能力后，輸入測(cè)試集進(jìn)行正式研發(fā)成果檢驗(yàn)。主辦方就修正后結(jié)果的準(zhǔn)確度、召回率和綜合評(píng)價(jià)指標(biāo)這三重評(píng)判標(biāo)準(zhǔn)進(jìn)行打分。

最終，網(wǎng)易有道AI團(tuán)隊(duì)以召回率第一、綜合評(píng)價(jià)指標(biāo)第一的絕對(duì)優(yōu)勢(shì)斬獲冠軍。

首戰(zhàn)告捷！網(wǎng)易有道斬獲首屆NLPCC中文語(yǔ)法錯(cuò)誤修正比賽冠軍 ?

網(wǎng)易有道的召回率和綜合評(píng)價(jià)指標(biāo)均為第一

本次奪冠，有道AI團(tuán)隊(duì)表示要?dú)w功于「多步推斷」的算法設(shè)計(jì)：先將表層錯(cuò)誤和深層次語(yǔ)法錯(cuò)誤分離、分層次解決，其次在修正過(guò)程中本真地還原人類的認(rèn)知行為——推敲。

為此，有道人工智能團(tuán)隊(duì)設(shè)計(jì)了字級(jí)別和子詞級(jí)別兩種神經(jīng)網(wǎng)絡(luò)模型，并將兩種模型進(jìn)行不同搭配組合，對(duì)例句做逐層推敲，得到5種修訂結(jié)果，再使用一個(gè)表征句子流利度的語(yǔ)言模型來(lái)對(duì)修訂結(jié)果進(jìn)行篩選，從而獲得最終結(jié)果。

首戰(zhàn)告捷！網(wǎng)易有道斬獲首屆NLPCC中文語(yǔ)法錯(cuò)誤修正比賽冠軍

AI“推敲”的模型流程圖

對(duì)于尚未完全成熟的中文語(yǔ)法錯(cuò)誤修正技術(shù)，網(wǎng)易有道首席科學(xué)家段亦濤表示，當(dāng)人工智能可以理解復(fù)雜度高的語(yǔ)法錯(cuò)誤，積累足量中文語(yǔ)料庫(kù)后，才會(huì)作為產(chǎn)品功能落地。根據(jù)雷鋒網(wǎng)記者了解，網(wǎng)易有道的產(chǎn)品矩陣中不乏針對(duì)CSL學(xué)習(xí)者的課程及產(chǎn)品，未來(lái)應(yīng)用場(chǎng)景廣闊，除了設(shè)計(jì)成面向中文學(xué)習(xí)者的自動(dòng)在線糾錯(cuò)學(xué)習(xí)工具，也可以與中小學(xué)校合作，為教師提供輔助批改。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

2人收藏

相關(guān)文章

黃善清

編輯

發(fā)私信

當(dāng)月熱門文章