1
在數(shù)字信息化的今天,人工智能的發(fā)展日益成熟,而隨著司法大數(shù)據(jù)的采集和積累,AI(Artificial Intelligence)技術(shù)有望在短時間內(nèi)處理大量文書、快速給出新案件的罪名、刑期及適用法條的推薦等任務(wù)中大顯身手。AI 技術(shù)不僅能提高法院等機構(gòu)的辦事效率,還能讓公民根據(jù)案情快速了解可能面臨的處罰,真正做到國家司法的公正性和高效能性。
為了實現(xiàn)法院審判體系和審判能力智能化,使得人工智能技術(shù)在「案例分析、法律文件閱讀與分析」等問題中更有力的發(fā)揮其作用,我們將公布世界上最大的裁判文書標(biāo)準(zhǔn)數(shù)據(jù)集,并希望通過組織本次比賽活動,與相關(guān)研究人員一起探索數(shù)據(jù)的可能性,積累具有智能審判能力的算法和模型,做出技術(shù)突破,為該領(lǐng)域的科學(xué)研究添磚加瓦。
或許你是一位胸懷抱負的科研人員,卻因繁縟又不具挑戰(zhàn)性的項目困在實驗室,無法全力施展自己的能力;或許你是一位 AI 領(lǐng)域的大牛,卻暫時沒能找到最適合自己的課題;或許你是一位剛剛?cè)腴T的新手,正苦于不知如何提升自己;也或許你懷抱著一顆愛國之心,想為祖國的法律事業(yè)攜去一縷清風(fēng)。
為此,我們在最高人民法院、中國中文信息學(xué)會、共青團中央青年發(fā)展部的共同指導(dǎo)下組織本次司法人工智能挑戰(zhàn)賽,我們將公布百萬量級的文本文件,誠邀對司法人工智能感興趣的個人或團隊開展相關(guān)研究,取得豐碩成果。
最高人民法院信息中心
中國中文信息學(xué)會
共青團中央青年發(fā)展部
中國司法大數(shù)據(jù)研究院
中國中文信息學(xué)會評測工委會
中國電科團委
清華大學(xué) 自然語言處理與社會人文計算實驗室
北京大學(xué) 計算機科學(xué)技術(shù)研究所
中國科學(xué)院軟件研究所 中文信息處理研究室
許建峰 最高人民法院信息中心主任
王 珩 中國司法大數(shù)據(jù)研究院總經(jīng)理
孫茂松 清華大學(xué)教授
孫 樂 中國科學(xué)院軟件研究所研究員
劉知遠 清華大學(xué)
馮巖松 北京大學(xué)
韓先培 中國科學(xué)院軟件研究所
胡 振 中國司法大數(shù)據(jù)研究院
比賽采取業(yè)界常用的本地訓(xùn)練、在線評測的賽制,具體說明如下:
第一階段:參賽隊伍利用公開的數(shù)據(jù)訓(xùn)練模型,每周允許提交 3 次,平臺將測試模型性能,并根據(jù)測試成績排名;
第二階段:第一階段結(jié)束時,所有參賽者提交最終比賽模型(或以最后提交的模型為準(zhǔn))。同時,主辦方將收集中國裁判文書網(wǎng)在隨后一個月內(nèi)每天新增的裁判文書數(shù)據(jù)作為新的測試集,對各參賽者的模型進行封閉評測,得到最終成績。
競賽任務(wù):
本次競賽的任務(wù)共有 3 個,分別是罪名預(yù)測,法律條款推薦,刑期預(yù)測。參賽選手可以選擇其中的一個或者多個任務(wù)進行挑戰(zhàn)。
罪名預(yù)測:提供文書中的案情描述和事實部分,預(yù)測被告人的罪名。
法律條款推薦:提供文書中的案情描述,預(yù)測本案涉及的相關(guān)法條。
刑期預(yù)測:對于刑事案件,根據(jù)案情描述和事實認定,預(yù)測被告人的刑期長短。
數(shù)據(jù)簡介:
本次挑戰(zhàn)賽所使用的數(shù)據(jù)集是來自「中國裁判文書網(wǎng)」公開的刑事法律文書,其中每份數(shù)據(jù)由法律文書中的案情描述和事實部分組成,同時也包括每個案件所涉及的法條、被告人被判的罪名和刑期長短等要素。
數(shù)據(jù)集共包括 268 萬份刑法法律文書,共涉及 183 條罪名,202 條法條,刑期長短包括 0-25 年、無期、死刑。
我們將先后發(fā)布 CAIL2018-Small 和 CAIL2018-Large 兩組數(shù)據(jù)集。CAIL2018-Small 包括 19.6 萬份文書樣例,直接在該網(wǎng)站發(fā)布,包括 15 萬訓(xùn)練集,1.6 萬驗證集和 3 萬測試集。這部分數(shù)據(jù)可以自由下載,供參賽者前期訓(xùn)練和測試。比賽開始 2-3 周后(具體時間請關(guān)注比賽新聞),我們將通過郵寄 U 盤(或網(wǎng)絡(luò)下載)向有資格的參賽隊伍定向發(fā)布 CAIL2018-Large 數(shù)據(jù)集,包括 150 萬份文書樣例。最后,剩余 90 萬份文書將作為第一階段的測試數(shù)據(jù) CAIL2018-Large-test。
參賽對象:
本次技術(shù)競賽面向全社會開放,相關(guān)領(lǐng)域的個人、科研機構(gòu)、高等院校、企業(yè)單位等人員均可報名參加。
報名方式:
競賽網(wǎng)站將于 2018 年 4 月 15 日開放注冊報名,請及時關(guān)注比賽主頁(http://cail.cipsc.org.cn/)。
報名時間:
2018 年 5 月 1 日至 2018 年 7 月 14 日。
獎項設(shè)置:
參賽選手將根據(jù)排名情況分享九萬獎金。另外還將為獲獎?wù)咛峁┯勺罡呷嗣穹ㄔ盒畔⒅行奶峁┑臉s譽證書認證。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。