0
本文作者: 叢末 | 2019-03-02 15:35 |
雷鋒網(wǎng) AI 科技評論按:國際文檔分析與識別國際會議(International Conference on Document Analysis and Recognition,ICDAR)是由國際模式識別學會(IAPR)組織的專業(yè)會議之一,其專注于文本領域的識別與應用,目前已經(jīng)是全球文檔圖像分析識別領域公認的權威學術會議。該會議每兩年舉辦一次,今年的 ICDAR 2019 將于 9 月 20-25 日在澳大利亞悉尼舉辦。雷鋒網(wǎng)雷鋒網(wǎng)
ICDAR 的一大重頭戲便是「魯棒文本閱讀競賽」(Robust Reading Competitions),該比賽于 2003 年設立,致力于提高自然場景的文本檢測和識別水平,至今已有來自 89 個國家的 3500 多支隊伍參與。
今年的 ICDAR 2019 上,美團將聯(lián)合國內(nèi)外知名科研機構和學者主辦「中文門臉招牌文字識別」比賽(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards)。據(jù)悉,美團將挑選出非常能代表中文特點的餐飲商家的門臉招牌圖片來組織競賽,這些招牌上的文字存在中文特有的設計和排版,同時也兼有自然場景文字識別中普遍存在的拍照角度、光照變化等干擾因素。值得一提的是,本次比賽所使用的數(shù)據(jù)集,便是美團即將公開的業(yè)界首個真實場景招牌圖像數(shù)據(jù)集。
比賽的具體信息如下:
組織者
美團:王棟、張睿、劉曦、周永生
華中科技大學:白翔、廖明輝、楊明錕
Microsoft (Redmond,USA):Baoguang Shi
Nanyang Technological University (Singapore):Shijian Lu
Computer Vision Centre,UAB(Spain):Dimosthenis Karatzas
IIIT Hyderabad(India):C. V. Jawahar
數(shù)據(jù)集介紹
美團本次公開的數(shù)據(jù),由遍布全國的市場人員所拍攝的眾多門臉招牌圖片組成,共 25000 張。每張圖片是由完全獨立的不同個人、采用不同設備、在不同地點和不同時間和不同環(huán)境下所拍攝的不同商家的門臉招牌圖片。該數(shù)據(jù)集以中文文字為主,也包含一定數(shù)量的英文和數(shù)字:英文和數(shù)字的占比介于 10% 和 30% 之間。標注內(nèi)容比較完備,每張圖片均標注了單個字符的位置和文本,以及各字符串的位置和文本,是難得的用于研發(fā)和評估中文識別技術的數(shù)據(jù)集。這 25000 張圖片中,20000 張圖片將用于訓練,2000 張將用于驗證,3000 張將用于測試。
數(shù)據(jù)集示例
比賽內(nèi)容
本次門臉招牌識別,共定義了 4 個任務,分別如下:
TASK 1:招牌端到端文字識別
TASK 2:招牌文字行定位
TASK 3:招牌區(qū)域內(nèi)單字識別
TASK 4:招牌區(qū)域內(nèi)字符串識別
獎勵方式
頒發(fā)獎狀:按照最終成績進行排名,以從高至低順序依次選取前三名,頒發(fā)獎狀。
比賽獎金:從高至低順序選取前三名參賽方為學校及科研院所等非盈利機構。
獎金具體設置如下:
重要日期
2019 年 3 月 1 日:報名通道開放
2019 年 3 月 18 日:訓練數(shù)據(jù)集開放
2019 年 4 月 15 日:測試數(shù)據(jù)集分批開放
2019 年 4 月 16 日:提交通道開放
2019 年 4 月 30 日:提交截止日期
2019 年 5 月 10 日:比賽最終報告提交
2019 年 9 月 20 日:ICDAR 2019 大會召開
參賽報名
報名鏈接地址: http://rrc.cvc.uab.es/?ch=12
報名鏈接二維碼:
感興趣的小伙伴們可以通過以上兩種方式報名參加比賽,一起瓜分 15000 美金!
信息來源:美團
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。