一句话生成3D模型:AI散布模型的突破,让建模师慌了

英伟达进入 AI 生成模型领域的钻研,直接比别人多一个次元:一句描述生成 3D 模型。

我们生活在三维的世界里,尽管目前大多数应用程序是 2D 的,但人们一直对 3D 数字实质有很高的需求,包括游玩、娱乐、建筑和机器人模拟等应用。

然而,创建专业的 3D 实质必要很高的艺术与审美素养和大量 3D 建模专业知识。人工完成这项工作必要花费大量时间和精力来培养这些技能。

需求大又是「劳动密集型行业」,那么有没有可能交给 AI 来做?上周五,英伟达提交到预印版论文平台 arXiv 的论文引起了人们的关注。

和现在流行的 NovelAI 差不多,人们只必要输入一段文字比如「一只坐在睡莲上的蓝色箭毒蛙」,AI 就能给你生成个纹理造型俱全的 3D 模型出来。

一句话生成3D模型:AI散布模型的突破,让建模师慌了

Magic3D 还可以执行鉴于提示的 3D 网格编辑:给定低分辨率 3D 模型和基本提示,可以更改文本从而修改生成的模型实质。此外,作者还展示了保持画风,以及将 2D 图象样式应用于 3D 模型的能力。

一句话生成3D模型:AI散布模型的突破,让建模师慌了

Stable Diffusion 的论文在 2022 年 8 月才首次提交,几个月就已经进化到这样的程度,不禁让人感叹科技发展的速度。

英伟达表示,你只必要在这个基础上稍作修改,生成的模型就可以当做游玩或 CGI 艺术场景的素材了。

3D 生成模型的方向并不神秘,其实在 9 月 29 日,谷歌曾经发布过一款文本到 3D 的生成模型 DreamFusion,英伟达在 Magic3D 的钻研中直接对标该办法。

一句话生成3D模型:AI散布模型的突破,让建模师慌了

类似于 DreamFusion 用文本生成 2D 图象,再将其优化为体积 NeRF(神经辐射场)数据的流程,Magic3D 应用两阶段生成法,用低分辨率生成的大略模型再优化到更高的分辨率。

英伟达的办法首先应用低分辨率散布先验获得粗糙模型,并应用稀疏 3D 哈希网格结构进行加速。用大略表示作为初始,再进一步优化了带纹理的 3D 网格模型,该模型具有与高分辨率潜在散布模型交互的高效可微分渲染器。

Magic3D 可以在 40 分钟内创建高质量的 3D 网格模型,比 DreamFusion 快 2 倍(后者平均必要 1.5 小时),同时还实现了更高的分辨率。统计表明相比 DreamFusion,61.7% 的人更喜欢英伟达的新办法。

连同图象调节生成功能,新技术为各种创意应用开辟了新途径。

一句话生成3D模型:AI散布模型的突破,让建模师慌了

论文链接:https://arxiv.org/abs/2211.10440

技术细节

Magic3D 可以在较短的计算时间内根据文本 prompt 分解高度详细的 3D 模型。Magic3D 通过改进 DreamFusion 中的几个主要设计选择来应用文本 prompt 分解高质量的 3D 实质。

具体来说,Magic3D 是一种从粗到精的优化办法,其中应用不同分辨率下的多个散布先验来优化 3D 表征,从而生成视图一致的几何形状以及高分辨率细节。Magic3D 应用监督办法分解 8 倍高分辨率的 3D 实质,速度也比 DreamFusion 快 2 倍。

Magic3D 的整个工作流程分为两个阶段:在第一阶段,该钻研优化了类似于 DreamFusion 的大略神经场表征,以实现具有鉴于哈希网格(hash grid)的内存和计算的高效场景表征。

在第二阶段该办法切换到优化网格表征。这个步骤很关键,它允许该办法在高达 512 × 512 的分辨率下利用散布先验。由于 3D 网格适用于快速图形渲染,可以实时渲染高分辨率图象,因此该钻研利用鉴于光栅化的高效微分渲染器和相机特写来恢复几何纹理中的高频细节。

一句话生成3D模型:AI散布模型的突破,让建模师慌了

鉴于上述两个阶段,该办法可以生成高保真的 3D 实质,并且很容易在标准图形软件中导入和可视化。

此外,该钻研展示了用文本 prompt 对 3D 分解过程的创造性控制能力,如下图 1 所示。

一句话生成3D模型:AI散布模型的突破,让建模师慌了

为了对比实际应用效果,英伟达的钻研人员把 Magic3D 和 DreamFusion 在 397 个文本提示生成的实质上进行了比较。平均的大略模型生成阶段花费 15 分钟,精细阶段训练了 25 分钟,所有运行时间均在 8 块英伟达 A100 GPU 上测得。

一句话生成3D模型:AI散布模型的突破,让建模师慌了

一句话生成3D模型:AI散布模型的突破,让建模师慌了

虽然论文和 demo 只是第一步,但英伟达已经为 Magic3D 想好了未来的应用方向:给游玩和元宇宙世界提供制作海量 3D 模型的工具,而且让所有人都可以上手应用。

当然,最早上线这项功能的可能会是英伟达自己的 Omniverse。

参考实质:https://arstechnica.com/information-technology/2022/11/nvidias-magic3d-creates-3d-models-from-written-descriptions-thanks-to-ai/

给TA打赏
共{{data.count}}人
人已打赏
AI

2023 IEEE Fellow出炉:唐立新、宗成庆、朱军、姬水旺、李佳等当选

2022-11-22 15:05:00

AI

火了一整年的多模态进修,在工业界的落地和实践进展到底怎么样了?

2022-11-23 15:46:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索