騰訊OCR團隊斬獲ICDAR大賽四項冠軍

本文作者： nebula

2023-10-20 15:44

導語：在全球文字識別（OCR）領域頂級盛會ICDAR 2023上，騰訊OCR團隊基于自研算法，斬獲四項冠軍。

在全球文字識別（OCR）領域頂級盛會ICDAR 2023上，騰訊OCR團隊基于自研算法，斬獲四項冠軍，這是繼2017年、2019年、2021年以來，連續(xù)四屆參會同時創(chuàng)造佳績，共獲得18項官方認證冠軍，展示了騰訊OCR技術在全球的一流水平。

ICDAR大會是全球文檔圖像分析識別領域公認的權威學術會議，每兩年舉辦一次，賽事舉辦至今已經吸引了超過100多個國家的近8000支隊伍參與其中。ICDAR競賽因其極高的技術難度和強大的實用性享譽國內外，與賽后非正式刷榜不同，ICDAR官方認證的正式競賽采用全新的數(shù)據集，并且在比賽期間不公布參賽團隊的信息和成績，同時限制了結果提交時間和次數(shù)，屬于高難度的“盲打”。

今年，騰訊OCR參賽團隊是由騰訊數(shù)據平臺部、微信技術架構部聯(lián)合組成，重點參加了DSText（稠密小文本視頻文本識別）和SVRD（結構化信息抽?。﹥纱箜椖康谋荣?，取得4項賽道冠軍。

DSText賽道，騰訊包攬全部兩項冠軍

DSText（稠密小文本視頻文本識別）競賽設置了2個任務：視頻文本跟蹤、視頻文本端到端識別。由于文字非常密集且非常小，再加上環(huán)境干擾（相機抖動、運動模糊、光照變化等）與后期編輯（多鏡頭切屏、人工背景、游戲界面切換等），從視頻幀中準確檢測、跟蹤、識別文本對算法魯棒性要求很高，挑戰(zhàn)性極大。部分比賽視頻幀展示如下：

騰訊OCR團隊斬獲ICDAR大賽四項冠軍

ICDAR-DSText競賽示意幀

在DSText競賽的全部2個任務中，騰訊OCR團隊均以絕對領先的優(yōu)勢獲得冠軍。

其中，任務1中，旨在跟蹤視頻中所有文本流，將視頻幀間屬于同一個文本實例的檢測框聚合起來，評價指標是MOTA，騰訊以領先第二名12.04%的成績取得冠軍。

騰訊OCR團隊斬獲ICDAR大賽四項冠軍

視頻文本跟蹤：冠軍證書

在任務2中，旨在評估視頻文本識別的端到端性能，任務要求在每一幀上正確檢測文本，在視頻幀上正確跟蹤，并在序列級別正確識別，評價指標是OCR-MOTA，騰訊以領先第二名11.93%的成績取得冠軍。

騰訊OCR團隊斬獲ICDAR大賽四項冠軍

視頻文本端到端識別：冠軍證書

SVRD賽道，騰訊以絕對優(yōu)勢獲得兩項冠軍

SVRD（結構化信息抽?。└傎惏琀UST-CELL和BAIDU-FEST兩大賽道共4個任務: 復雜文檔實體關系提取(E2E Complex Entity Linking)、復雜文檔實體語義提取(E2E Complex Entity Labeling)、零樣本結構化信息抽取(E2E Zero-shot Structured Text Extraction)和小樣本結構化信息提取(Few-shot Structured Text Extraction)。由于文檔圖像版式復雜、結構多樣，自然場景圖像采集不規(guī)范、存在背景復雜、折損、彎曲、形變等問題，競賽存在較大的挑戰(zhàn)難度。部分比賽圖片展示如下：

騰訊OCR團隊斬獲ICDAR大賽四項冠軍

ICDAR-SVRD結構化信息抽取大賽樣例

在SVRD競賽中騰訊OCR團隊共獲得了2個冠軍。

其中，任務2 （E2E Complex Entity Labeling）旨在提取復雜文檔圖像上的語義實體，如標題、機構名、日期、金額、數(shù)字、商品名、人名等，騰訊在這個任務上以較大優(yōu)勢取得了冠軍

騰訊OCR團隊斬獲ICDAR大賽四項冠軍

E2E Complex Entity Labeling：冠軍證書

任務4 （E2E Few-shot Structured Text Extraction）賽題需要在提供非常少量訓練數(shù)據的前提下，提取10個不同場景下的圖像的關鍵信息，如銀行卡、營業(yè)執(zhí)照、出租車發(fā)票、購物小票、交通發(fā)票、定額發(fā)票、論文等場景下的關鍵信息，騰訊同樣取得了冠軍。

騰訊OCR團隊斬獲ICDAR大賽四項冠軍

E2E Few-shot Structured Text Extraction：冠軍證書

據介紹，騰訊OCR團隊是騰訊內部致力于研究和開發(fā)OCR技術的專業(yè)團隊，團隊在技術上自主研發(fā)了高精準度、高穩(wěn)定性的文本檢測和識別技術，在應用上，支持了騰訊內數(shù)百個業(yè)務場景，如騰訊廣告、微信、QQ、騰訊云、騰訊視頻、騰訊信息流產品。

雷峰網(公眾號：雷峰網)

雷峰網版權文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

nebula

運營

發(fā)私信

當月熱門文章

騰訊OCR團隊斬獲ICDAR大賽四項冠軍

DSText賽道，騰訊包攬全部兩項冠軍

SVRD賽道，騰訊以絕對優(yōu)勢獲得兩項冠軍

SVRD賽道，騰訊以絕對優(yōu)勢獲得兩項冠軍