美图影像研究院（MT Lab）斩获3项国际人工智能顶会大奖

2024-06-26 01:02

5月30日，国际人工智能顶会CVPR 2024举办的第3届野外像素级视频理解挑战赛（The 3rd Pixel-level Video Understanding in the Wild, PVUW。下文简称PVUW）公布赛事结果，美图影像研究院（MT Lab）再获殊荣，斩获视频语义分割（VSS）、复杂场景视频目标分割（MOSE）双赛道亚军，视频全景分割挑战赛（VPS）赛道季军，这也是美图影像研究院（MT Lab）第3次在CVPR大会上摘得奖项，共获得了1金3银3铜的杰出成绩。作为全球范围内计算机视觉领域的顶级会议

作为全球范围内计算机视觉领域的顶级会议，CVPR凭借其广泛影响力吸引了大批顶尖高校、科研院所等参与其中，成为全球AI领域领先科研团队展示前沿研究成果的舞台，深受学术界及产业界的关注。

美图影像研究院（MT Lab）斩获3项国际人工智能顶会大奖

同时，PVUW赛事专注于视频理解领域，由牛津大学、复旦大学、浙江大学、北京航天航空大学、北京交通大学、Amazon、Meta等学术界及产业界的顶尖研究者共同发起，凭借其前沿性及挑战性，本届竞赛吸引了包括中国科学院大学、中国科学院自动化研究所、哈尔滨工业大学、美图公司、三星、中兴通讯等海内外高校、科研院所及知名企业参加。

本届PVUW竞赛共包含4个赛道，除视频语义分割挑战赛（VSS Challenge）、视频全景分割挑战赛（VPS Challenge）外，新增复杂场景视频目标分割挑战赛（MOSE Challenge）和基于动作描述的指向性视频分割挑战赛（MeViS Challenge）2个超高难度赛道，其中，复杂场景视频目标分割挑战赛（MOSE Challenge）采集了目前最大规模的复杂场景视频目标分割数据集Complex Video Object Segmentation (MOSE)，包括目标的消失和重现、不显眼的小物体、严重的遮挡以及拥挤的环境等。旨在于帮助应对视频理解领域目前面临的如背景复杂性、目标遮挡和消失重现、描述动作的文本理解等挑战，提升对复杂场景及现实场景的理解能力。

美图影像研究院（MT Lab）斩获3项国际人工智能顶会大奖

美图影像研究院（MT Lab）此次参赛取得的优异成绩背后，是在视频领域长期布局与持续探索的成果证明，同时也已将这一前沿技术应用于美图公司旗下美图秀秀、美颜相机、Wink、美图设计室等产品中，为用户带来“视频人像精修”、“AI商品视频”、“智能抠图”等实用功能与创意玩法，通过创新研发成果为广大用户提供优质影像与设计服务。

随着新兴视频形态的蓬勃发展，视频行业进一步向多元化发展，美图影像研究院（MT Lab）也持续加大在视频领域的研发投入，目前专业视频人像精修工具Wink荣登视频编辑工具赛道第二名，开拍已成为口播创作工具赛道第一名。

作为美图的核心研发中枢，美图影像研究院（MT Lab）未来也将继续专注于AI领域前沿技术研发，推动AI技术的落地应用，通过技术创新与升级为用户和客户打造更好的AI工作流。

摩尔线程重磅开源两大AI框架，国产GPU训练效率突破90%

深度计算领域再添利器!摩尔线程今日重磅宣布，正式开源MT-MegatronLM与MT-TransformerEngine两大AI框架，这一举措将为国产计算基础设施注入强劲动力。这两大框架通过深度融合FP8混合训练策略和高性能算子库，成功在国产全功能GPU上实现混合并行训练和推理，大幅提升了大模型训练的效率与稳定性。摩尔线程此次开源的MT-MegatronLM框架专为全功能GPU打造，支持dense模型、多模态模型及MoE（混合专家）模型的高效训练，满足了当前AI领域多样化的训练需求。

3/18/2025 10:46:00 AM

AI在线