0
本文作者: 孔令雙 | 2018-03-28 10:30 |
雷鋒網(wǎng) AI 研習(xí)社消息,近日,猿輔導(dǎo)超過了百度、微軟,登頂微軟 MSMarco(Microsoft Machine Reading Comprehension)機(jī)器閱讀理解測(cè)試排行。
據(jù)猿輔導(dǎo)透露,此次提交的 MARS(Multi-Attention ReaderS)模型,采用層疊式的注意力機(jī)制在多候選文檔采樣出多個(gè)候選答案區(qū)域,并在此基礎(chǔ)上使用交叉投票模型,優(yōu)化最終的答案。
圖:MSMarco 排名情況
MS MARCO 是微軟發(fā)布的一套 10 萬個(gè)問答組成的數(shù)據(jù)集,人工智能領(lǐng)域的研究人員可用它來構(gòu)建能夠與真人相媲美的問答系統(tǒng)。猿輔導(dǎo) NLP 團(tuán)隊(duì)上傳的 MARS 模型給出的答案,在官方評(píng)測(cè)指標(biāo)(Bleu-1 和 Rouge-L)上測(cè)試得分為:49.72、48.02,而人類基準(zhǔn)為 47、46,這不僅在 MSMARCO 排行榜上首次出現(xiàn),在全球閱讀理解任務(wù)上也是首次。
另外,猿輔導(dǎo)的模型在 semEval(國際語義評(píng)測(cè))上的閱讀理解 task 上獲得了第二名,而此前猿輔導(dǎo)曾在 SQUAD 數(shù)據(jù)集上,單模型第三。
猿輔導(dǎo)應(yīng)用研究團(tuán)隊(duì)成立于 2014 年年中,一直從事深度學(xué)習(xí)在教育領(lǐng)域的應(yīng)用和研究工作。團(tuán)隊(duì)成員均畢業(yè)于北京大學(xué)、清華大學(xué)、上海交大、中科院、香港大學(xué)等知名高校,大多數(shù)擁有碩士或博士學(xué)位。
圖:MSMarco 官方推文
為什么要做機(jī)器閱讀理解?猿輔導(dǎo)表示:「從公司組建起,我們就有自己的應(yīng)用研究部,AI 做為教育未來應(yīng)用的底層技術(shù),我們公司也在著重打造自己在這方面的能力,包括猿輔導(dǎo)在線課程在內(nèi)的公司各項(xiàng)業(yè)務(wù),也都享受著 AI 技術(shù)帶來的推動(dòng)和變革。」
機(jī)器閱讀理解、語音識(shí)別、手寫識(shí)別、圖像識(shí)別等技術(shù),分別被應(yīng)用在了猿輔導(dǎo)的在線輔導(dǎo)課程,小猿搜題、小猿口算、斑馬英語等等產(chǎn)品中,諸如小猿搜題的搜題功能,英文作文的手寫識(shí)別及打分,小猿口算的拍照批改,斑馬英語的繪本朗讀打分等等。
不過,機(jī)器閱讀理解只是猿輔導(dǎo)眾多 AI 技術(shù)方向中的一支,該公司一直在技術(shù)層面上做更多的嘗試,研究方向涵蓋了圖像識(shí)別,語音識(shí)別、自然語言理解、數(shù)據(jù)挖掘、深度學(xué)習(xí)等領(lǐng)域。對(duì)于機(jī)器閱讀理解的研究,猿輔導(dǎo)希望將其應(yīng)用在教育行業(yè)中,例如高考作文的自動(dòng)批改,閱讀理解的自動(dòng)出題等,語文題目的自動(dòng)作答等。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。