0
2020 年 3 月,由國家三部委聯(lián)合指導(dǎo)、廈門市政府主辦、百度承辦的中國人工智能大賽·語言與知識技術(shù)競賽(個人賽)即將開賽。競賽圍繞「機器閱讀理解」主題展開,設(shè)立了面向觀點型問題的機器閱讀理解任務(wù),參賽者在這一競賽中,則需要設(shè)計出回答段落摘要所包含是非觀點極性的模型。
長期以來,人工智能被認為是引領(lǐng)未來的戰(zhàn)略性技術(shù),同時,對推動國家和城市的經(jīng)濟、加速未來發(fā)展至關(guān)重要。
而機器閱讀理解作為自然語言處理界進步最快的技術(shù)方向之一,也是自然語言處理和人工智能領(lǐng)域的重要前沿課題,對于提升機器智能水平、使機器具有持續(xù)知識獲取能力具有重要價值。
而且,由于該技術(shù)應(yīng)用范圍非常廣泛,近年來也受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。
本屆中國人工智能大賽·語言與知識技術(shù)競賽正是圍繞了「機器閱讀理解」主題展開,旨在為研究者提供開放的學(xué)術(shù)交流平臺,提升閱讀理解的研究水平,推動語言理解和人工智能領(lǐng)域技術(shù)和應(yīng)用的發(fā)展。
同時,于自然語言處理方面的人才與團隊而言,這是一個大展身手的優(yōu)質(zhì)平臺;對于有志于落戶廈門,并在此領(lǐng)域深耕的科技人才,這也未免不是值得嘗試的機會。
面向觀點型問題的機器閱讀理解,通常源于真實的應(yīng)用場景,例如:針對用戶輸入的觀點型問題,智能搜索問答系統(tǒng)檢索相關(guān)候選文檔,然后給出最終的是非觀點。
本次中國人工智能大賽·語言與知識技術(shù)競賽的任務(wù),也聚焦于預(yù)測答案段落摘要中所表述的是非觀點極性。
面向觀點型問題的機器閱讀理解技術(shù)在智能搜索問答中的應(yīng)用示例
簡而言之,即:要求參賽者根據(jù)搜索場景中用戶輸入的觀點型問題,從數(shù)據(jù)集中抽取出能夠回答用戶問題的答案段落摘要,并給出摘要中包含的是非觀點,最終完成多個觀點型問題的機器閱讀理解任務(wù)。
該競賽共分為個人賽和團體賽兩類(報名需二選一)。團體賽面向優(yōu)質(zhì)企業(yè)和專業(yè)團隊公開招募,個人賽面則向個人開發(fā)者公開招募。
個人賽報名時間:截至 2020 年 3 月 15 日
團體賽報名時間:持續(xù)報名中,截止日期待定
其中團體賽設(shè)置選拔賽和邀請賽,選拔賽階段成績優(yōu)異的團體可進入邀請賽。
在個人賽中,賽方提供了 12 萬的高額獎金池,一、二、三等獎獲獎?wù)叻謩e獎勵 5 萬元、2 萬元、8000 元;優(yōu)勝獎品為 2000 元京東卡。其中:
一等獎:1 名
二等獎:2 名
三等獎:3 名
優(yōu)勝獎:4 名
而團體賽獲獎隊伍競賽前三名,可獲得廈門市政府專項落戶、扶持政策和創(chuàng)新創(chuàng)業(yè)培訓(xùn)課程等支持,以及百度黃埔學(xué)院-首席 AI 架構(gòu)師培養(yǎng)計劃的直通名額。
所有獲獎選手均獲得中國人工智能大賽組委會頒發(fā)的國家級 AI 競賽證書。
歷屆證書樣例
若競賽獲獎?wù)叱晒β鋺魪B門,廈門市政府還會額外附上落地獎勵、研發(fā)補助、研發(fā)空間、人才住房等多項扶持。針對人工智能產(chǎn)業(yè)頂尖人才和創(chuàng)業(yè)團隊,廈門市政府還將給予 1000 萬元至 1 億元的項目資助。
除豐厚的獎金之外,競賽還提供了大量機器閱讀理解的數(shù)據(jù)及 Tesla V100 免費 GPU 算力平臺,同時提供了專業(yè)的培訓(xùn),以及學(xué)術(shù)界和產(chǎn)業(yè)界專家指導(dǎo),支持與幫助所有個人參賽者和參賽團隊。
本次競賽提供基于 DuReader 的中文是非觀點型問題閱讀理解數(shù)據(jù)集。包含 7 萬問答對以及人工標注的答案段落摘要和相應(yīng)的是非觀點極性。
DuReader 是一個面向真實應(yīng)用的、開放域的、最大規(guī)模的中文問答閱讀理解數(shù)據(jù)集。其優(yōu)勢是數(shù)據(jù)來源真實:DuReader 的問題是百度搜索中用戶提出的真實問題,并且答案都經(jīng)過了人工標注。
DuReader 數(shù)據(jù)集 Github 地址:
本次競賽還為選手提供樣例數(shù)據(jù)、訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。其中:
樣例數(shù)據(jù)同賽題一起發(fā)布,選手通過報名審核后可在競賽官網(wǎng)下載。
訓(xùn)練數(shù)據(jù)集將于正式開賽后統(tǒng)一發(fā)放,選手可使用賽事主辦方提供的訓(xùn)練數(shù)據(jù)集進行訓(xùn)練,模型所使用的數(shù)據(jù)和字段不做限制。
測試數(shù)據(jù)集將分別發(fā)放,其中個人賽和團體選拔賽的測試數(shù)據(jù)集將于評測入口開放前一周發(fā)放,邀請賽測試數(shù)據(jù)集不發(fā)放。
關(guān)于數(shù)據(jù)集范圍,所有問題均為搜索引擎中按照用戶行為分布的觀點類的問題,對應(yīng)的文檔為搜索引擎搜索出來的網(wǎng)頁。
答案片段摘要則是經(jīng)過人工標注的回答此問題的答案片段,是非觀點極性是此答案片段摘要相對于問題的觀點極性。
本次競賽面向全社會開放,不限年齡、身份、相關(guān)領(lǐng)域的個人、高等院校、科研機構(gòu)、企業(yè)單位、初創(chuàng)團隊等人員均可報名參賽。 具體內(nèi)容包括:
個人賽僅限 1 名開發(fā)者報名且無法重復(fù)參加團體賽。
團體賽參賽隊伍人數(shù)不超過 3 人(線下自由組隊),允許跨單位自由組隊,每人只能參加一支隊伍。
個人參賽者及參賽團隊報名所填報的資料、信息應(yīng)該是準確、真實、有效、合法、完整的,如若發(fā)現(xiàn)有虛假和隱瞞,將被取消參賽資格。
最新賽程(個人賽)安排
個人賽報名直達:
https://aistudio.baidu.com/aistudio/competition/detail/25
團體賽報名直達:
https://aistudio.baidu.com/aistudio/competition/detail/26
中國人工智能大賽官方網(wǎng)站:
雷鋒網(wǎng) AI 源創(chuàng)評論 雷鋒網(wǎng) 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。