腾讯OCR团队斩获ICDAR大赛四项冠军

在全球文字辨别(OCR)领域顶级盛会ICDAR 2023上,腾讯OCR团队基于自研算法,斩获四项冠军,这是继2017年、2019年、2021年以来,连续四届参会同时创造佳绩,共获得18项官方认证冠军,展示了腾讯OCR技术在全球的一流水平。ICDAR大会是全球文档图象分析辨别领域公认的权威学术会议,每两年举办一次,赛事举办至今已经吸引了超过100多个国家的近8000支队伍参与其中。ICDAR竞争因其极高的技术难度和强大的实用性享誉国内外,与赛后非正式刷榜不同,ICDAR官方认证的正式竞争采用全新的数据集,并且在竞争期

在全球文字辨别(OCR)领域顶级盛会ICDAR 2023上,腾讯OCR团队基于自研算法,斩获四项冠军,这是继2017年、2019年、2021年以来,连续四届参会同时创造佳绩,共获得18项官方认证冠军,展示了腾讯OCR技术在全球的一流水平。

ICDAR大会是全球文档图象分析辨别领域公认的权威学术会议,每两年举办一次,赛事举办至今已经吸引了超过100多个国家的近8000支队伍参与其中。ICDAR竞争因其极高的技术难度和强大的实用性享誉国内外,与赛后非正式刷榜不同,ICDAR官方认证的正式竞争采用全新的数据集,并且在竞争期间不公布参赛团队的信息和成绩,同时限制了结果提交时间和次数,属于高难度的“盲打”。

今年,腾讯OCR参赛团队是由腾讯数据平台部、微信技术架构部联合组成,重点参加了DSText(稠密小文本视频文本辨别)和SVRD(结构化信息抽取)两大项目的竞争,夺得4项赛道冠军。

DSText赛道,腾讯包揽全部两项冠军

DSText(稠密小文本视频文本辨别)竞争设置了2个使命:视频文本追踪、视频文本端到端辨别。由于文字非常密集且非常小,再加上环境干扰(相机抖动、运动模糊、光照变化等)与后期编辑(多镜头切屏、人工背景、游戏界面切换等),从视频帧中准确检测、追踪、辨别文本对算法鲁棒性要求很高,挑战性极大。部分竞争视频帧展示如下:

腾讯OCR团队斩获ICDAR大赛四项冠军

ICDAR-DSText竞争示意帧

在DSText竞争的全部2个使命中,腾讯OCR团队均以绝对领先的优势获得冠军。

其中,使命1中,旨在追踪视频中所有文本流,将视频帧间属于同一个文本实例的检测框聚合起来,评价指标是MOTA,腾讯以领先第二名12.04%的成绩夺得冠军。

腾讯OCR团队斩获ICDAR大赛四项冠军视频文本追踪:冠军证书

在使命2中,旨在评估视频文本辨别的端到端性能,使命要求在每一帧上正确检测文本,在视频帧上正确追踪,并在序列级别正确辨别,评价指标是OCR-MOTA,腾讯以领先第二名11.93%的成绩夺得冠军。

腾讯OCR团队斩获ICDAR大赛四项冠军视频文本端到端辨别:冠军证书

SVRD赛道,腾讯以绝对优势获得两项冠军

SVRD(结构化信息抽取)竞争包含HUST-CELL和BAIDU-FEST两大赛道共4个使命:简单文档实体关系提炼(E2E Complex Entity Linking)、简单文档实体语义提炼(E2E Complex Entity Labeling)、零样本结构化信息抽取(E2E Zero-shot Structured Text Extraction)和小样本结构化信息提炼(Few-shot Structured Text Extraction)。由于文档图象版式简单、结构多样,自然场景图象采集不规范、存在背景简单、折损、弯曲、形变等问题,竞争存在较大的挑战难度。部分竞争图片展示如下:

腾讯OCR团队斩获ICDAR大赛四项冠军

ICDAR-SVRD结构化信息抽取大赛样例

在SVRD竞争中腾讯OCR团队共获得了2个冠军。

其中,使命2(E2E Complex Entity Labeling)旨在提炼简单文档图象上的语义实体,如标题、机构名、日期、金额、数字、商品名、人名等,腾讯在这个使命上以较大优势夺得了冠军

腾讯OCR团队斩获ICDAR大赛四项冠军

E2E Complex Entity Labeling:冠军证书

使命4(E2E Few-shot Structured Text Extraction)赛题需要在提供非常少量训练数据的前提下,提炼10个不同场景下的图象的关键信息,如银行卡、营业执照、出租车发票、购物小票、交通发票、定额发票、论文等场景下的关键信息,腾讯同样夺得了冠军。

腾讯OCR团队斩获ICDAR大赛四项冠军

E2E Few-shot Structured Text Extraction:冠军证书

据介绍,腾讯OCR团队是腾讯内部致力于研究和开发OCR技术的专业团队,团队在技术上自主研发了高精准度、高稳定性的文本检测和辨别技术,在应用上,支持了腾讯内数百个业务场景,如腾讯广告、微信、QQ、腾讯云、腾讯视频、腾讯信息流产品。

给TA打赏
共{{data.count}}人
人已打赏
应用

智加科技与春风柳汽达成深度合作 主动驾驭重卡计划2024年初量产交付

2023-10-20 15:05:00

应用

病毒式传递的短视频,也许就是这个GPT-4工具剪出来的

2023-10-20 17:48:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索