美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖

5月30日,国际人工智能顶会CVPR 2024举办的第3届野外像素级视频理解挑战赛(The 3rd Pixel-level Video Understanding in the Wild, PVUW。下文简称PVUW)公布赛事结果,美图影像研究院(MT Lab)再获殊荣,斩获视频语义分割(VSS)、复杂场景视频目标分割(MOSE)双赛道亚军,视频全景分割挑战赛(VPS)赛道季军,这也是美图影像研究院(MT Lab)第3次在CVPR大会上摘得奖项,共获得了1金3银3铜的杰出成绩。作为全球范围内计算机视觉领域的顶级会议

5月30日,国际人工智能顶会CVPR 2024举办的第3届野外像素级视频理解挑战赛(The 3rd Pixel-level Video Understanding in the Wild, PVUW。下文简称PVUW)公布赛事结果,美图影像研究院(MT Lab)再获殊荣,斩获视频语义分割(VSS)、复杂场景视频目标分割(MOSE)双赛道亚军,视频全景分割挑战赛(VPS)赛道季军,这也是美图影像研究院(MT Lab)第3次在CVPR大会上摘得奖项,共获得了1金3银3铜的杰出成绩。

美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖

作为全球范围内计算机视觉领域的顶级会议,CVPR凭借其广泛影响力吸引了大批顶尖高校、科研院所等参与其中,成为全球AI领域领先科研团队展示前沿研究成果的舞台,深受学术界及产业界的关注。

美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖

同时,PVUW赛事专注于视频理解领域,由牛津大学、复旦大学、浙江大学、北京航天航空大学、北京交通大学、Amazon、Meta等学术界及产业界的顶尖研究者共同发起,凭借其前沿性及挑战性,本届竞赛吸引了包括中国科学院大学、中国科学院自动化研究所、哈尔滨工业大学、美图公司、三星、中兴通讯等海内外高校、科研院所及知名企业参加。

本届PVUW竞赛共包含4个赛道,除视频语义分割挑战赛(VSS Challenge)、视频全景分割挑战赛(VPS Challenge)外,新增复杂场景视频目标分割挑战赛(MOSE Challenge)和基于动作描述的指向性视频分割挑战赛(MeViS Challenge)2个超高难度赛道,其中,复杂场景视频目标分割挑战赛(MOSE Challenge)采集了目前最大规模的复杂场景视频目标分割数据集Complex Video Object Segmentation (MOSE),包括目标的消失和重现、不显眼的小物体、严重的遮挡以及拥挤的环境等。旨在于帮助应对视频理解领域目前面临的如背景复杂性、目标遮挡和消失重现、描述动作的文本理解等挑战,提升对复杂场景及现实场景的理解能力。

美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖

美图影像研究院(MT Lab)此次参赛取得的优异成绩背后,是在视频领域长期布局与持续探索的成果证明,同时也已将这一前沿技术应用于美图公司旗下美图秀秀、美颜相机、Wink、美图设计室等产品中,为用户带来“视频人像精修”、“AI商品视频”、“智能抠图”等实用功能与创意玩法,通过创新研发成果为广大用户提供优质影像与设计服务。

随着新兴视频形态的蓬勃发展,视频行业进一步向多元化发展,美图影像研究院(MT Lab)也持续加大在视频领域的研发投入,目前专业视频人像精修工具Wink荣登视频编辑工具赛道第二名,开拍已成为口播创作工具赛道第一名。

作为美图的核心研发中枢,美图影像研究院(MT Lab)未来也将继续专注于AI领域前沿技术研发,推动AI技术的落地应用,通过技术创新与升级为用户和客户打造更好的AI工作流。

相关资讯

5300亿参数的「威震天-图灵」,微软、英伟达合力造出超大语 言模型

在微软和英伟达的共同努力下, Turing NLG 17B 和 Megatron-LM 模型的继承者诞生了:5300 亿参数,天生强大,它的名字叫做「Megatron-Turing」。

美图携手ACM Multimedia 2022举办第四届PIC竞赛 聚焦美妆场景

2022年7月1日,美图影像研究院(MT Lab)联合北京航天航空大学、中国人民大学在ACM国际多媒体会议(ACM International Conference on Multimedia, ACM MM)上主办的第四届Person in Context(PIC)竞赛圆满收官。 此次PIC竞赛因其前沿性和实用性吸引了来自清华大学、北京大学、上海交通大学、香港大学、中国科学技术大学等知名高校,以及腾讯、京东、小米、bilibili等知名企业共58支队伍报名参赛,参赛人数再创新高。竞赛共分设三个赛道,涵盖视频内容时

CVPR 2021 | 创新奇智首次提出零样本实例分割,助力解决工业场景数据瓶颈难题

对于数据发现、数据粗筛、辅助标注、模型基本能力探索等方面有巨大的提升。