0
本文作者: 楊鯉萍 | 2020-03-06 14:05 |
2020 年 3 月,由國(guó)家三部委聯(lián)合指導(dǎo)、廈門市政府主辦、百度承辦的中國(guó)人工智能大賽·語言與知識(shí)技術(shù)競(jìng)賽(個(gè)人賽)即將開賽。競(jìng)賽圍繞「機(jī)器閱讀理解」主題展開,設(shè)立了面向觀點(diǎn)型問題的機(jī)器閱讀理解任務(wù),參賽者在這一競(jìng)賽中,則需要設(shè)計(jì)出回答段落摘要所包含是非觀點(diǎn)極性的模型。
長(zhǎng)期以來,人工智能被認(rèn)為是引領(lǐng)未來的戰(zhàn)略性技術(shù),同時(shí),對(duì)推動(dòng)國(guó)家和城市的經(jīng)濟(jì)、加速未來發(fā)展至關(guān)重要。
而機(jī)器閱讀理解作為自然語言處理界進(jìn)步最快的技術(shù)方向之一,也是自然語言處理和人工智能領(lǐng)域的重要前沿課題,對(duì)于提升機(jī)器智能水平、使機(jī)器具有持續(xù)知識(shí)獲取能力具有重要價(jià)值。
而且,由于該技術(shù)應(yīng)用范圍非常廣泛,近年來也受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。
本屆中國(guó)人工智能大賽·語言與知識(shí)技術(shù)競(jìng)賽正是圍繞了「機(jī)器閱讀理解」主題展開,旨在為研究者提供開放的學(xué)術(shù)交流平臺(tái),提升閱讀理解的研究水平,推動(dòng)語言理解和人工智能領(lǐng)域技術(shù)和應(yīng)用的發(fā)展。
同時(shí),于自然語言處理方面的人才與團(tuán)隊(duì)而言,這是一個(gè)大展身手的優(yōu)質(zhì)平臺(tái);對(duì)于有志于落戶廈門,并在此領(lǐng)域深耕的科技人才,這也未免不是值得嘗試的機(jī)會(huì)。
面向觀點(diǎn)型問題的機(jī)器閱讀理解,通常源于真實(shí)的應(yīng)用場(chǎng)景,例如:針對(duì)用戶輸入的觀點(diǎn)型問題,智能搜索問答系統(tǒng)檢索相關(guān)候選文檔,然后給出最終的是非觀點(diǎn)。
本次中國(guó)人工智能大賽·語言與知識(shí)技術(shù)競(jìng)賽的任務(wù),也聚焦于預(yù)測(cè)答案段落摘要中所表述的是非觀點(diǎn)極性。
面向觀點(diǎn)型問題的機(jī)器閱讀理解技術(shù)在智能搜索問答中的應(yīng)用示例
簡(jiǎn)而言之,即:要求參賽者根據(jù)搜索場(chǎng)景中用戶輸入的觀點(diǎn)型問題,從數(shù)據(jù)集中抽取出能夠回答用戶問題的答案段落摘要,并給出摘要中包含的是非觀點(diǎn),最終完成多個(gè)觀點(diǎn)型問題的機(jī)器閱讀理解任務(wù)。
該競(jìng)賽共分為個(gè)人賽和團(tuán)體賽兩類(報(bào)名需二選一)。團(tuán)體賽面向優(yōu)質(zhì)企業(yè)和專業(yè)團(tuán)隊(duì)公開招募,個(gè)人賽面則向個(gè)人開發(fā)者公開招募。
個(gè)人賽報(bào)名時(shí)間:截至 2020 年 3 月 15 日
團(tuán)體賽報(bào)名時(shí)間:持續(xù)報(bào)名中,截止日期待定
其中團(tuán)體賽設(shè)置選拔賽和邀請(qǐng)賽,選拔賽階段成績(jī)優(yōu)異的團(tuán)體可進(jìn)入邀請(qǐng)賽。
在個(gè)人賽中,賽方提供了 12 萬的高額獎(jiǎng)金池,一、二、三等獎(jiǎng)獲獎(jiǎng)?wù)叻謩e獎(jiǎng)勵(lì) 5 萬元、2 萬元、8000 元;優(yōu)勝獎(jiǎng)品為 2000 元京東卡。其中:
一等獎(jiǎng):1 名
二等獎(jiǎng):2 名
三等獎(jiǎng):3 名
優(yōu)勝獎(jiǎng):4 名
而團(tuán)體賽獲獎(jiǎng)隊(duì)伍競(jìng)賽前三名,可獲得廈門市政府專項(xiàng)落戶、扶持政策和創(chuàng)新創(chuàng)業(yè)培訓(xùn)課程等支持,以及百度黃埔學(xué)院-首席 AI 架構(gòu)師培養(yǎng)計(jì)劃的直通名額。
所有獲獎(jiǎng)選手均獲得中國(guó)人工智能大賽組委會(huì)頒發(fā)的國(guó)家級(jí) AI 競(jìng)賽證書。
歷屆證書樣例
若競(jìng)賽獲獎(jiǎng)?wù)叱晒β鋺魪B門,廈門市政府還會(huì)額外附上落地獎(jiǎng)勵(lì)、研發(fā)補(bǔ)助、研發(fā)空間、人才住房等多項(xiàng)扶持。針對(duì)人工智能產(chǎn)業(yè)頂尖人才和創(chuàng)業(yè)團(tuán)隊(duì),廈門市政府還將給予 1000 萬元至 1 億元的項(xiàng)目資助。
除豐厚的獎(jiǎng)金之外,競(jìng)賽還提供了大量機(jī)器閱讀理解的數(shù)據(jù)及 Tesla V100 免費(fèi) GPU 算力平臺(tái),同時(shí)提供了專業(yè)的培訓(xùn),以及學(xué)術(shù)界和產(chǎn)業(yè)界專家指導(dǎo),支持與幫助所有個(gè)人參賽者和參賽團(tuán)隊(duì)。
本次競(jìng)賽提供基于 DuReader 的中文是非觀點(diǎn)型問題閱讀理解數(shù)據(jù)集。包含 7 萬問答對(duì)以及人工標(biāo)注的答案段落摘要和相應(yīng)的是非觀點(diǎn)極性。
DuReader 是一個(gè)面向真實(shí)應(yīng)用的、開放域的、最大規(guī)模的中文問答閱讀理解數(shù)據(jù)集。其優(yōu)勢(shì)是數(shù)據(jù)來源真實(shí):DuReader 的問題是百度搜索中用戶提出的真實(shí)問題,并且答案都經(jīng)過了人工標(biāo)注。
DuReader 數(shù)據(jù)集 Github 地址:
本次競(jìng)賽還為選手提供樣例數(shù)據(jù)、訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。其中:
樣例數(shù)據(jù)同賽題一起發(fā)布,選手通過報(bào)名審核后可在競(jìng)賽官網(wǎng)下載。
訓(xùn)練數(shù)據(jù)集將于正式開賽后統(tǒng)一發(fā)放,選手可使用賽事主辦方提供的訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,模型所使用的數(shù)據(jù)和字段不做限制。
測(cè)試數(shù)據(jù)集將分別發(fā)放,其中個(gè)人賽和團(tuán)體選拔賽的測(cè)試數(shù)據(jù)集將于評(píng)測(cè)入口開放前一周發(fā)放,邀請(qǐng)賽測(cè)試數(shù)據(jù)集不發(fā)放。
關(guān)于數(shù)據(jù)集范圍,所有問題均為搜索引擎中按照用戶行為分布的觀點(diǎn)類的問題,對(duì)應(yīng)的文檔為搜索引擎搜索出來的網(wǎng)頁。
答案片段摘要?jiǎng)t是經(jīng)過人工標(biāo)注的回答此問題的答案片段,是非觀點(diǎn)極性是此答案片段摘要相對(duì)于問題的觀點(diǎn)極性。
本次競(jìng)賽面向全社會(huì)開放,不限年齡、身份、相關(guān)領(lǐng)域的個(gè)人、高等院校、科研機(jī)構(gòu)、企業(yè)單位、初創(chuàng)團(tuán)隊(duì)等人員均可報(bào)名參賽。 具體內(nèi)容包括:
個(gè)人賽僅限 1 名開發(fā)者報(bào)名且無法重復(fù)參加團(tuán)體賽。
團(tuán)體賽參賽隊(duì)伍人數(shù)不超過 3 人(線下自由組隊(duì)),允許跨單位自由組隊(duì),每人只能參加一支隊(duì)伍。
個(gè)人參賽者及參賽團(tuán)隊(duì)報(bào)名所填報(bào)的資料、信息應(yīng)該是準(zhǔn)確、真實(shí)、有效、合法、完整的,如若發(fā)現(xiàn)有虛假和隱瞞,將被取消參賽資格。
最新賽程(個(gè)人賽)安排
個(gè)人賽報(bào)名直達(dá):
https://aistudio.baidu.com/aistudio/competition/detail/25
團(tuán)體賽報(bào)名直達(dá):
https://aistudio.baidu.com/aistudio/competition/detail/26
中國(guó)人工智能大賽官方網(wǎng)站:
雷鋒網(wǎng) AI 源創(chuàng)評(píng)論 雷鋒網(wǎng) 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。