CVPR 2024

CVPR最佳论文候选 | NeRF新突破，用启发式引导分割去除瞬态干扰物，无需额外先验知识
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected] 论文第一作者为中山大学计算机学院研二硕士生陈家豪，研究方向为神经…
工程
- 19
- 0
机器之心7月10日
导师爆料：这篇CVPR最好学生论文，从设法主意到成稿只用一个月，源自业余灵感
按部就班 vs. 好奇心驱动，哪个更容易出钻研成果？ CVPR 2024 的最好学生论文，竟然是用一个月的时间写出来的。北京时间 6 月 20 日凌晨，CVPR 2024 正式公布了最好论文、最好学生论文等奖项。其中，获得最好论文的有两篇文章 ——BioCLIP 和 Mip-Splatting。据 Mip-Splatting 论文一作 Zehao Yu 的导师、图宾根大学教授 Andreas G…
工程
- 7
- 0
机器之心6月24日
CVPR 2024｜让图象聚集模型生成高质量360度场景，只需要一个说话模型
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，灵验促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]蔡志鹏博士（）是美国英特尔研究院的研究员，博士毕业于澳大利亚阿德莱德…
应用
- 5
- 0
机器之心6月11日
329篇图像、视频生成论文，今年CVPR最火的钻研中心是这些
图像与视频合成、3D 视觉、人体行为辨认、视觉与谈话推理等钻研偏向论文最多，属于最热门的偏向，体现当前学界对视觉生成、三维感知、人机交互等偏向的高度重视。另外，多模态学习、以人为本的设计和自适应机器人可能构成人形机器人的未来。一年一度的计算机视觉和模式辨认会议（CVPR）一直是 CV 界前沿钻研的灯塔。CVPR 2024 任用结果显示，今年共有 2719 篇论文被接收，任用率 23.6%。那么大模…
应用
- 27
- 0
机器之心6月9日
CVPR 2024 | 分解视频数据集里只有单人数据？M3Act破解人群行为标注难题
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级试验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]论文链接：：：M3Act: Learning from Synthe…
应用
- 7
- 0
机器之心6月3日
大模型时代的计算机视觉！CVPR 2024线上论文分享会启动
自从 OpenAI 发布 ChatGPT 以来，整个技术社区对大模型、AIGC的关切越来越高。今年年初，Sora 的横空出世更是将视频生成的热度推向了一个新的高潮。大模型时代，计算机视觉规模的热点话题也在不断的发生着变化。面对应接不暇的研究，我们如何才能在最快的时间了解 AI 规模的最新科研成果与发展趋势？参加顶会论文分享会就是一个不错的选择。作为计算机视觉（CV）规模的顶级会议，CVPR 每年都…
应用
- 43
- 0
机器之心5月8日
CVPR 2024 | 借助神经构造光，浙大实现动向三维现象的实时收集重修
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的处事想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]。对于烟雾等动向三维物理现象的高效高品质收集重修是相关科学研讨中的重…
工程
- 6
- 0
机器之心5月6日
CVPR 2024 | 文本一键转3D数字人骨骼动画，阿尔伯塔大学提出MoMask框架
AIxiv专栏是机器之心发布学术、技术实质的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇实质，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]。想象一下，你仅需要输入一段简单的文本描述，就可以生成对应的 3D …
应用
- 16
- 0
机器之心4月29日
CVPR 2024 | 擅长处理复杂场景和说话表达，清华&博世提出全新实例朋分网络架构MagNet
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]。指代朋分 (Referring Image Segmentatio…
工程
- 12
- 0
机器之心4月26日
CVPR 2024 | 基于MoE的通用图象融会模型，添加2.8%参数完成多项任意
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级试验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]。论文链接：：：Task-Customized Mixture of…
工程
- 8
- 0
机器之心4月24日
CVPR 2024 | 仅需文本或图象提醒，新框架CustomNeRF精准编写3D场景
美图影像研究院（MT Lab）与中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了 3D 场景编写办法 ——CustomNeRF，同时支持文本描绘和参照图象作为 3D 场景的编写提醒，该研究成果已被 CVPR 2024 接收。自 2020 年神经辐射场 (Neural Radiance Field, NeRF) 提出以来，将隐式表达推上了一个新的高度。作为当前最前沿的技术之一，NeRF…
工程
- 35
- 0
机器之心4月15日
CVPR 2024 | 联系一切模型SAM泛化能力差？域顺应策略给解决了
第一个针对「Segment Anything」大模型的域顺应策略来了！相关论文已被CVPR 2024 接收。引言大语言模型（LLMs）的成功激发了计算机视觉领域探索联系基础模型的兴趣。这些基础联系模型通常通过 Prompt Engineer 来举行 zero/few 图象联系。其中，Segment Anything Model（SAM）是最先进的图象联系基础模型。 …
工程
- 10
- 0
机器之心4月9日
二次元专用超分AI模型APISR：在线可用，入选CVPR
《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是很多人童年回忆的一部分，它们曾给我们带来了充满了热血、友情与梦想的视觉之旅。某些时候，我们会突然有重温这些童年回忆的冲动，但我们却可能会略带遗憾地发现这些童年回忆的分辨率非常低，根本无法在客厅的 4K 大屏电视上创造出良好的视觉体验，以至于可能阻碍我们与在高分辨率数字世界中成长的孩子分享这些童年回忆。针对这样的困扰（以及潜在的市场），…
工程
- 6
- 0
机器之心4月7日
CVPR 2024满分论文，英伟达开源BOP排行榜6D物体姿势第一名要领
物体姿势预计对于各种应用至关重要，例如机器人操纵和混合现实。实例级要领通常需要纹理 CAD 模型来生成训练数据，并且不能应用于测试时未见过的新物体；而类别级要领消除了这些假定（实例训练和 CAD 模型），但获取类别级训练数据需要应用额外的姿势标准化和检查步骤。为了解决这些问题，来自英伟达的钻研团队提出了一个统一的框架，称为 FoundationPose，它在鉴于模型和无模型树立下，运用 RGBD …
应用
- 15
- 0
机器之心4月6日
CVPR 2024｜生成不了光线极强的图片？微信视觉团队有效办理聚集模型奇点课题
聚集模型凭借其在图象生成方面的出色表现，开启了生成式模型的新纪元。诸如 Stable Diffusion，DALLE，Imagen，SORA 等大模型如雨后春笋般涌现，进一步丰富了生成式 AI 的使用前景。然而，当前的聚集模型在理论上并非完美，鲜有研讨关注到采样时间端点处未定义的奇点课题。此外，奇点课题在使用中导致的平衡灰度等影响生成图象质量的课题也一直未得到办理。为了办理这一难题，微信视觉团队与…
工程
- 8
- 0
机器之心3月28日
CVPR 2024 | 零样本6D物体姿势预计框架SAM-6D，向具身智能更进一步
物体姿势预计在许多现实世界应用中起到至关重要的作用，例如具身智能、机器人灵巧操作和增强现实等。在这一领域中，最先受到关注的任务是实例级别 6D 姿势预计，其需要关于目的物体的带标注数据进行模型训练，使深度模型具有物体特定性，无法迁移应用到新物体上。后来研究热点逐步转向类别级别 6D 姿势预计，用于处理未见过的物体，但要求该物体属于已知的感兴趣类别。而零样本 6D 姿势预计是一种更具泛化性的任务设置…
工程
- 11
- 0
机器之心3月25日
提升生成式零样本进修能力，视觉增强动态语义原型办法入选CVPR 2024
虽然我从来没见过你，但是我有可能「认识」你 —— 这是人们希望人工智能在「一眼初见」下达到的状态。为了达到这个目的，在传统的图象鉴别任务中，人们在带有不同种别标签的大量图象样本上训练算法模型，让模型获得对这些图象的鉴别能力。而在零样本进修（ZSL）任务中，人们希望模型能够举一反三，鉴别在训练阶段没有见过图象样本的种别。生成式零样本进修（GZSL）是实现零样本进修的一种有效办法。在生成式零样本进修中…
工程
- 7
- 0
机器之心3月15日
AI图片橡皮擦来了，清华&阿里合作推出「观点半透膜」模型，还能改头换面
一只橘猫，减去「猫」，它会变成什么？第一步在常见 AI 作图模型输入「一只胖胖的像面包的橘猫」，画出一只长得很像面包的猫猫，然后用观点半透膜 SPM 技术，将猫猫这个观点擦掉，结果它就失去梦想变成了一只面包。上图 1 是更多的猫猫图失去猫这个观点后的结果。图 1 观点半透膜 SPM 针对不同的「猫」图擦除猫观点后的成果下图 2 到图 …
工程
- 6
- 0
机器之心3月13日
CVPR 2024满分论文：浙大提出鉴于可变形三维高斯的高质量单目静态重修新步骤
单目静态场景（Monocular Dynamic Scene）是指使用单眼摄像头观察并分析的静态环境，其中场景中的物体可以自由移动。单目静态场景重修对于理解环境中的静态变化、预测物体运动轨迹以及静态数字资产生成等任务至关重要。随着以神经辐射场（Neural Radiance Field, NeRF）为代表的神经衬着的兴起，越来越多的工作开始使用隐式表征（implicit representatio…
工程
- 5
- 0
机器之心3月4日