丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給nebula
發(fā)送

0

騰訊OCR團(tuán)隊(duì)斬獲ICDAR大賽四項(xiàng)冠軍

本文作者: nebula 2023-10-20 15:44
導(dǎo)語:在全球文字識(shí)別(OCR)領(lǐng)域頂級盛會(huì)ICDAR 2023上,騰訊OCR團(tuán)隊(duì)基于自研算法,斬獲四項(xiàng)冠軍。

在全球文字識(shí)別(OCR)領(lǐng)域頂級盛會(huì)ICDAR 2023上,騰訊OCR團(tuán)隊(duì)基于自研算法,斬獲四項(xiàng)冠軍,這是繼2017年、2019年、2021年以來,連續(xù)四屆參會(huì)同時(shí)創(chuàng)造佳績,共獲得18項(xiàng)官方認(rèn)證冠軍,展示了騰訊OCR技術(shù)在全球的一流水平。

ICDAR大會(huì)是全球文檔圖像分析識(shí)別領(lǐng)域公認(rèn)的權(quán)威學(xué)術(shù)會(huì)議,每兩年舉辦一次,賽事舉辦至今已經(jīng)吸引了超過100多個(gè)國家的近8000支隊(duì)伍參與其中。ICDAR競賽因其極高的技術(shù)難度和強(qiáng)大的實(shí)用性享譽(yù)國內(nèi)外,與賽后非正式刷榜不同,ICDAR官方認(rèn)證的正式競賽采用全新的數(shù)據(jù)集,并且在比賽期間不公布參賽團(tuán)隊(duì)的信息和成績,同時(shí)限制了結(jié)果提交時(shí)間和次數(shù),屬于高難度的“盲打”。

今年,騰訊OCR參賽團(tuán)隊(duì)是由騰訊數(shù)據(jù)平臺(tái)部、微信技術(shù)架構(gòu)部聯(lián)合組成,重點(diǎn)參加了DSText(稠密小文本視頻文本識(shí)別)和SVRD(結(jié)構(gòu)化信息抽?。﹥纱箜?xiàng)目的比賽,取得4項(xiàng)賽道冠軍。

DSText賽道,騰訊包攬全部兩項(xiàng)冠軍

DSText(稠密小文本視頻文本識(shí)別)競賽設(shè)置了2個(gè)任務(wù):視頻文本跟蹤、視頻文本端到端識(shí)別。由于文字非常密集且非常小,再加上環(huán)境干擾(相機(jī)抖動(dòng)、運(yùn)動(dòng)模糊、光照變化等)與后期編輯(多鏡頭切屏、人工背景、游戲界面切換等),從視頻幀中準(zhǔn)確檢測、跟蹤、識(shí)別文本對算法魯棒性要求很高,挑戰(zhàn)性極大。部分比賽視頻幀展示如下:

騰訊OCR團(tuán)隊(duì)斬獲ICDAR大賽四項(xiàng)冠軍

ICDAR-DSText競賽示意幀

在DSText競賽的全部2個(gè)任務(wù)中,騰訊OCR團(tuán)隊(duì)均以絕對領(lǐng)先的優(yōu)勢獲得冠軍。

其中,任務(wù)1中,旨在跟蹤視頻中所有文本流,將視頻幀間屬于同一個(gè)文本實(shí)例的檢測框聚合起來,評價(jià)指標(biāo)是MOTA,騰訊以領(lǐng)先第二名12.04%的成績?nèi)〉霉谲姟?/p>

騰訊OCR團(tuán)隊(duì)斬獲ICDAR大賽四項(xiàng)冠軍

視頻文本跟蹤:冠軍證書

在任務(wù)2中,旨在評估視頻文本識(shí)別的端到端性能,任務(wù)要求在每一幀上正確檢測文本,在視頻幀上正確跟蹤,并在序列級別正確識(shí)別,評價(jià)指標(biāo)是OCR-MOTA,騰訊以領(lǐng)先第二名11.93%的成績?nèi)〉霉谲姟?/p>

騰訊OCR團(tuán)隊(duì)斬獲ICDAR大賽四項(xiàng)冠軍

視頻文本端到端識(shí)別:冠軍證書

SVRD賽道,騰訊以絕對優(yōu)勢獲得兩項(xiàng)冠軍

SVRD(結(jié)構(gòu)化信息抽取)競賽包含HUST-CELL和BAIDU-FEST兩大賽道共4個(gè)任務(wù): 復(fù)雜文檔實(shí)體關(guān)系提取(E2E Complex Entity Linking)、復(fù)雜文檔實(shí)體語義提取(E2E Complex Entity Labeling)、零樣本結(jié)構(gòu)化信息抽取(E2E Zero-shot Structured Text Extraction)和小樣本結(jié)構(gòu)化信息提取(Few-shot Structured Text Extraction)。由于文檔圖像版式復(fù)雜、結(jié)構(gòu)多樣,自然場景圖像采集不規(guī)范、存在背景復(fù)雜、折損、彎曲、形變等問題,競賽存在較大的挑戰(zhàn)難度。部分比賽圖片展示如下:

騰訊OCR團(tuán)隊(duì)斬獲ICDAR大賽四項(xiàng)冠軍

ICDAR-SVRD結(jié)構(gòu)化信息抽取大賽樣例

在SVRD競賽中騰訊OCR團(tuán)隊(duì)共獲得了2個(gè)冠軍。

其中,任務(wù)2 (E2E Complex Entity Labeling)旨在提取復(fù)雜文檔圖像上的語義實(shí)體,如標(biāo)題、機(jī)構(gòu)名、日期、金額、數(shù)字、商品名、人名等,騰訊在這個(gè)任務(wù)上以較大優(yōu)勢取得了冠軍

騰訊OCR團(tuán)隊(duì)斬獲ICDAR大賽四項(xiàng)冠軍

E2E Complex Entity Labeling:冠軍證書

任務(wù)4 (E2E Few-shot Structured Text Extraction)賽題需要在提供非常少量訓(xùn)練數(shù)據(jù)的前提下,提取10個(gè)不同場景下的圖像的關(guān)鍵信息,如銀行卡、營業(yè)執(zhí)照、出租車發(fā)票、購物小票、交通發(fā)票、定額發(fā)票、論文等場景下的關(guān)鍵信息,騰訊同樣取得了冠軍。

騰訊OCR團(tuán)隊(duì)斬獲ICDAR大賽四項(xiàng)冠軍

E2E Few-shot Structured Text Extraction:冠軍證書

據(jù)介紹,騰訊OCR團(tuán)隊(duì)是騰訊內(nèi)部致力于研究和開發(fā)OCR技術(shù)的專業(yè)團(tuán)隊(duì),團(tuán)隊(duì)在技術(shù)上自主研發(fā)了高精準(zhǔn)度、高穩(wěn)定性的文本檢測和識(shí)別技術(shù),在應(yīng)用上,支持了騰訊內(nèi)數(shù)百個(gè)業(yè)務(wù)場景,如騰訊廣告、微信、QQ、騰訊云、騰訊視頻、騰訊信息流產(chǎn)品。

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說