腾讯混元开源 Hunyuan3D-1.0：首个同时支持文生和图生的 3D 开源大模型

作者：沛霖（实习）

2024-11-05 06:44

腾讯混元今日开源了 Hunyuan3D-1.0 大模型，官方称这是首个同时支持文生和图生的 3D 开源大模型。 ▲ 文生模型▲ 图生模型模型采用两阶段生成方法，官方表示在保证质量和可控的基础上，10 秒即可生成 3D 资产：第一阶段，团队采用了一种多视角扩散模型，轻量版模型能够在大约 4 秒内生成多视角图像。这些多视角图像从不同的视角捕捉了 3D 资产的丰富的纹理和几何先验，将任务从单视角重建松弛到多视角重建第二阶段，团队引入了一种前馈重建模型，利用上一阶段生成的多视角图像。

腾讯混元今日开源了 Hunyuan3D-1.0 大模型，官方称这是首个同时支持文生和图生的 3D 开源大模型。

▲ 文生模型

腾讯混元开源 Hunyuan3D-1.0：首个同时支持文生和图生的 3D 开源大模型

▲ 图生模型

模型采用两阶段生成方法，官方表示在保证质量和可控的基础上，10 秒即可生成 3D 资产：

第一阶段，团队采用了一种多视角扩散模型，轻量版模型能够在大约 4 秒内生成多视角图像。这些多视角图像从不同的视角捕捉了 3D 资产的丰富的纹理和几何先验，将任务从单视角重建松弛到多视角重建
第二阶段，团队引入了一种前馈重建模型，利用上一阶段生成的多视角图像。该模型能够在大约 3 秒内快速而准确地重建 3D 资产。重建模型学习处理多视角扩散引入的噪声和不一致性，并利用条件图像中的可用信息高效恢复 3D 结构
最终该模型可以实现输入任意单视角实现三维生成

腾讯混元开源 Hunyuan3D-1.0：首个同时支持文生和图生的 3D 开源大模型