丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給楊曉凡
發(fā)送

0

SQuAD 2.0來了!現(xiàn)在這里有了機器「無法回答的問題」

本文作者: 楊曉凡 2018-06-13 16:01
導語:自然語言處理現(xiàn)在也有了對抗性問題

雷鋒網(wǎng) AI 科技評論按:斯坦福大學 NLP 組(Stanford NLP Group)昨晚發(fā)出公告,文本理解挑戰(zhàn)賽 & 數(shù)據(jù)集 SQuAD 升級為 SQuAD 2.0,在原來基礎上增加對抗性問題的同時,也新增了一項任務「判斷一個問題能否根據(jù)提供的閱讀文本作答」。新版本 SQuAD 2.0 由斯坦福大學計算機系 Pranav Rajpurkar, Robin Jia, Percy Liang 三人在獲得 ACL 2018 最佳論文獎的論文《Know What You Don't Know: Unanswerable Questions for SQuAD》(https://arxiv.org/abs/1806.03822)中提出。SQuAD 頁面的主題色也從玫紅色更換為了藍紫色。

SQuAD 2.0來了!現(xiàn)在這里有了機器「無法回答的問題」

基于 SQuAD(Stanford Question Answering Dataset)的文本理解挑戰(zhàn)賽,是行業(yè)內公認的機器閱讀理解領域的頂級水平測試;它構建了一個包含十萬個問題的大規(guī)模機器閱讀理解數(shù)據(jù)集,選取超過 500 篇的維基百科文章。數(shù)據(jù)集中每一個閱讀理解問題的答案是來自給定的閱讀文章的一小段文本 —— 以及,現(xiàn)在在 SQuAD 2.0 中還要判斷這個問題是否能夠根據(jù)當前的閱讀文本作答。

在原來的 SQuAD(SQuAD 1.1)的十萬個問題 - 答案對的基礎上,SQuAD 2.0 中新增了超過五萬個新增的、由人類眾包者對抗性地設計的無法回答的問題。執(zhí)行 SQuAD 2.0 閱讀理解任務的模型不僅要能夠在問題可回答時給出答案,還要判斷哪些問題是閱讀文本中沒有材料支持的,并拒絕回答這些問題。

SQuAD 2.0來了!現(xiàn)在這里有了機器「無法回答的問題」

圖示為兩個無法回答的問題。紅色標出的答案看似有理,但其實是錯誤的。

Pranav Rajpurkar, Robin Jia, Percy Liang 三人撰寫了論文《Know What You Don't Know: Unanswerable Questions for SQuAD》對這一新任務以及 SQuAD 2.0 做了介紹。論文中為 SQuAD 2.0 設立了新的人類表現(xiàn)基準線(EM 86.831,F(xiàn)1 89.452)的同時,也通過對比展現(xiàn)出了 SQuAD 2.0 的難度:一個強有力的基于神經(jīng)網(wǎng)絡的系統(tǒng)可以在 SQuAD 1.1 上得到 86% 的 F1 分數(shù),但在 SQuAD 2.0 上只能得到 66%。這篇論文也獲得了 ACL 2018 最佳論文獎。其它四篇最佳論文介紹請看這里

詳細信息歡迎訪問 SQuAD 網(wǎng)站(Stanford-qa.com)以及閱讀論文(https://arxiv.org/abs/1806.03822)。雷鋒網(wǎng) AI 科技評論報道。

相關文章:

一窺 ACL 2018 最佳論文

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

SQuAD 2.0來了!現(xiàn)在這里有了機器「無法回答的問題」

分享:
相關文章

讀論文為生

日常笑點滴,學術死腦筋
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說