AI在线 AI在线

MIDI

CVPR 2025 | VAST和北航开源MIDI,从单张图像端到端生成三维组合场景

本文的主要作者来自 VAST、北京航空航天大学、清华大学和香港大学。 本文的第一作者为北京航空航天大学硕士生黄泽桓,主要研究方向为生成式人工智能和三维视觉。 本文的通讯作者为 VAST 首席科学家曹炎培和北京航空航天大学副教授盛律。
3/14/2025 11:55:00 AM
机器之心

告别平面!MIDI:可提取图片元素生成360度3D场景

还在对着二维照片里的美好场景望眼欲穿?梦想着能身临其境地漫步在那些迷人画面之中?现在,这个愿望有望成为现实!来自CVPR2025的重磅研究——MIDI(Multi-Instance Diffusion for Single Image to3D Scene Generation,多实例扩散单图到3D场景生成)横空出世,它就像一位技艺高超的魔法师,仅凭一张普通的2D图片,就能为你构建出一个栩栩如生的360度3D场景。 一图胜千言?现在还能“变”出整个世界!想象一下,你拍摄了一张阳光洒落的咖啡馆一角,照片里有精致的桌椅、香气四溢的咖啡杯,以及窗外婆娑的树影。 过去,这仅仅是一张静态的平面图像。
3/12/2025 9:35:00 AM
AI在线
  • 1