AI在线 AI在线

美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖

作者:新闻助手
2024-06-26 01:02
5月30日,国际人工智能顶会CVPR 2024举办的第3届野外像素级视频理解挑战赛(The 3rd Pixel-level Video Understanding in the Wild, PVUW。下文简称PVUW)公布赛事结果,美图影像研究院(MT Lab)再获殊荣,斩获视频语义分割(VSS)、复杂场景视频目标分割(MOSE)双赛道亚军,视频全景分割挑战赛(VPS)赛道季军,这也是美图影像研究院(MT Lab)第3次在CVPR大会上摘得奖项,共获得了1金3银3铜的杰出成绩。作为全球范围内计算机视觉领域的顶级会议

5月30日,国际人工智能顶会CVPR 2024举办的第3届野外像素级视频理解挑战赛(The 3rd Pixel-level Video Understanding in the Wild, PVUW。下文简称PVUW)公布赛事结果,美图影像研究院(MT Lab)再获殊荣,斩获视频语义分割(VSS)、复杂场景视频目标分割(MOSE)双赛道亚军,视频全景分割挑战赛(VPS)赛道季军,这也是美图影像研究院(MT Lab)第3次在CVPR大会上摘得奖项,共获得了1金3银3铜的杰出成绩。

美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖

作为全球范围内计算机视觉领域的顶级会议,CVPR凭借其广泛影响力吸引了大批顶尖高校、科研院所等参与其中,成为全球AI领域领先科研团队展示前沿研究成果的舞台,深受学术界及产业界的关注。

美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖

同时,PVUW赛事专注于视频理解领域,由牛津大学、复旦大学、浙江大学、北京航天航空大学、北京交通大学、Amazon、Meta等学术界及产业界的顶尖研究者共同发起,凭借其前沿性及挑战性,本届竞赛吸引了包括中国科学院大学、中国科学院自动化研究所、哈尔滨工业大学、美图公司、三星、中兴通讯等海内外高校、科研院所及知名企业参加。

本届PVUW竞赛共包含4个赛道,除视频语义分割挑战赛(VSS Challenge)、视频全景分割挑战赛(VPS Challenge)外,新增复杂场景视频目标分割挑战赛(MOSE Challenge)和基于动作描述的指向性视频分割挑战赛(MeViS Challenge)2个超高难度赛道,其中,复杂场景视频目标分割挑战赛(MOSE Challenge)采集了目前最大规模的复杂场景视频目标分割数据集Complex Video Object Segmentation (MOSE),包括目标的消失和重现、不显眼的小物体、严重的遮挡以及拥挤的环境等。旨在于帮助应对视频理解领域目前面临的如背景复杂性、目标遮挡和消失重现、描述动作的文本理解等挑战,提升对复杂场景及现实场景的理解能力。

美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖

美图影像研究院(MT Lab)此次参赛取得的优异成绩背后,是在视频领域长期布局与持续探索的成果证明,同时也已将这一前沿技术应用于美图公司旗下美图秀秀、美颜相机、Wink、美图设计室等产品中,为用户带来“视频人像精修”、“AI商品视频”、“智能抠图”等实用功能与创意玩法,通过创新研发成果为广大用户提供优质影像与设计服务。

随着新兴视频形态的蓬勃发展,视频行业进一步向多元化发展,美图影像研究院(MT Lab)也持续加大在视频领域的研发投入,目前专业视频人像精修工具Wink荣登视频编辑工具赛道第二名,开拍已成为口播创作工具赛道第一名。

作为美图的核心研发中枢,美图影像研究院(MT Lab)未来也将继续专注于AI领域前沿技术研发,推动AI技术的落地应用,通过技术创新与升级为用户和客户打造更好的AI工作流。

相关标签:

相关资讯

摩尔线程重磅开源两大AI框架,国产GPU训练效率突破90%

深度计算领域再添利器!摩尔线程今日重磅宣布,正式开源MT-MegatronLM与MT-TransformerEngine两大AI框架,这一举措将为国产计算基础设施注入强劲动力。 这两大框架通过深度融合FP8混合训练策略和高性能算子库,成功在国产全功能GPU上实现混合并行训练和推理,大幅提升了大模型训练的效率与稳定性。 摩尔线程此次开源的MT-MegatronLM框架专为全功能GPU打造,支持dense模型、多模态模型及MoE(混合专家)模型的高效训练,满足了当前AI领域多样化的训练需求。
3/18/2025 10:46:00 AM
AI在线

摩尔线程开源 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架

摩尔线程官方今日发文宣布,近日已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现高效的混合并行训练和推理,提升了训练效率与稳定性。
3/17/2025 6:28:02 PM
归泷(实习)

5300亿参数的「威震天-图灵」,微软、英伟达合力造出超大语 言模型

在微软和英伟达的共同努力下, Turing NLG 17B 和 Megatron-LM 模型的继承者诞生了:5300 亿参数,天生强大,它的名字叫做「Megatron-Turing」。
10/12/2021 2:42:00 PM
机器之心