趕超百度微軟登頂 MSMARCO，猿輔導(dǎo)機器閱讀理解超過人類水平

本文作者：孔令雙

2018-03-28 10:30

導(dǎo)語：AI 會成為未來教育應(yīng)用的底層技術(shù)。

猿輔導(dǎo)

+10

AI影響因子

比賽

比賽名稱：微軟MARCO

年份：2018

企業(yè)：猿輔導(dǎo)

操作：競賽

名次：1

雷鋒網(wǎng) AI 研習(xí)社消息，近日，猿輔導(dǎo)超過了百度、微軟，登頂微軟 MSMarco（Microsoft Machine Reading Comprehension）機器閱讀理解測試排行。

據(jù)猿輔導(dǎo)透露，此次提交的 MARS（Multi-Attention ReaderS）模型，采用層疊式的注意力機制在多候選文檔采樣出多個候選答案區(qū)域，并在此基礎(chǔ)上使用交叉投票模型，優(yōu)化最終的答案。

趕超百度微軟登頂 MSMARCO，猿輔導(dǎo)機器閱讀理解超過人類水平

圖：MSMarco 排名情況

MS MARCO 是微軟發(fā)布的一套 10 萬個問答組成的數(shù)據(jù)集，人工智能領(lǐng)域的研究人員可用它來構(gòu)建能夠與真人相媲美的問答系統(tǒng)。猿輔導(dǎo) NLP 團隊上傳的 MARS 模型給出的答案，在官方評測指標（Bleu-1 和 Rouge-L）上測試得分為：49.72、48.02，而人類基準為 47、46，這不僅在 MSMARCO 排行榜上首次出現(xiàn)，在全球閱讀理解任務(wù)上也是首次。

另外，猿輔導(dǎo)的模型在 semEval(國際語義評測)上的閱讀理解 task 上獲得了第二名，而此前猿輔導(dǎo)曾在 SQUAD 數(shù)據(jù)集上，單模型第三。

猿輔導(dǎo)應(yīng)用研究團隊成立于 2014 年年中，一直從事深度學(xué)習(xí)在教育領(lǐng)域的應(yīng)用和研究工作。團隊成員均畢業(yè)于北京大學(xué)、清華大學(xué)、上海交大、中科院、香港大學(xué)等知名高校，大多數(shù)擁有碩士或博士學(xué)位。

趕超百度微軟登頂 MSMARCO，猿輔導(dǎo)機器閱讀理解超過人類水平

圖：MSMarco 官方推文

為什么要做機器閱讀理解？猿輔導(dǎo)表示：「從公司組建起，我們就有自己的應(yīng)用研究部，AI 做為教育未來應(yīng)用的底層技術(shù)，我們公司也在著重打造自己在這方面的能力，包括猿輔導(dǎo)在線課程在內(nèi)的公司各項業(yè)務(wù)，也都享受著 AI 技術(shù)帶來的推動和變革?！?/p>

機器閱讀理解、語音識別、手寫識別、圖像識別等技術(shù)，分別被應(yīng)用在了猿輔導(dǎo)的在線輔導(dǎo)課程，小猿搜題、小猿口算、斑馬英語等等產(chǎn)品中，諸如小猿搜題的搜題功能，英文作文的手寫識別及打分，小猿口算的拍照批改，斑馬英語的繪本朗讀打分等等。

不過，機器閱讀理解只是猿輔導(dǎo)眾多 AI 技術(shù)方向中的一支，該公司一直在技術(shù)層面上做更多的嘗試，研究方向涵蓋了圖像識別，語音識別、自然語言理解、數(shù)據(jù)挖掘、深度學(xué)習(xí)等領(lǐng)域。對于機器閱讀理解的研究，猿輔導(dǎo)希望將其應(yīng)用在教育行業(yè)中，例如高考作文的自動批改，閱讀理解的自動出題等，語文題目的自動作答等。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

2人收藏

相關(guān)文章

孔令雙

編輯

發(fā)私信

當(dāng)月熱門文章

趕超百度微軟登頂 MSMARCO，猿輔導(dǎo)機器閱讀理解超過人類水平

趕超百度微軟登頂 MSMARCO，猿輔導(dǎo)機器閱讀理解超過人類水平