3D

一张图即可 0.5 秒生成三维建模，Stability AI 推出“Stable Fast 3D”模型

Stability AI 今天推出了一款名为 Stable Fast 3D 的 AI 模型，该模型主打“图生 3D 模型”，号称只需 0.5 秒就能快速生成完整且自然的 3D 模型，目前该模型已在 Hugging Face 平台上架，感兴趣的小伙伴们可以（点此访问）。AI在线获悉，Stable Fast 3D 只需要单张图片即可快速生成高质量的 3D 模型，相关模型自带材质及对应的参数，同时提供了精确的 UV 展开（UV Unwrapping）便于用户进行后期修改，如果用户需要，还可以选择四边形或三角形网格重建功能

8/2/2024 10:45:08 PM

漾仔

智加科技论文DualBEV入选计算机视觉顶会ECCV

近日，智加科技团队论文《DualBEV: Unifying Dual Veiw Transformation with Probabilistic Correspondences》入选欧洲计算机视觉国际会议(ECCV, European Conference on Computer Vision)，ECCV是计算机视觉领域最具影响力和权威性的国际会议之一，与国际计算机视觉大会(ICCV)和计算机视觉与模式识别会议(CVPR)齐名，被誉为计算机视觉领域的“三大顶会”之一。ECCV 每两年举办一次，汇聚了全球顶尖的研究

7/9/2024 11:13:00 AM

新闻助手

Meta 发布 3D Gen AI 模型：1 分钟内生成高质量 3D 内容

Meta 公司昨日（7 月 2 日）发布研究论文，介绍了名为 Meta 3D Gen（3DGen）的全新 AI 模型，可以在 1 分钟内基于用户输入的提示词，生成高质量的 3D 内容。Meta 公司表示 Meta 3D Gen（3DGen）所生成的 3D 内容具备高分辨率纹理和材质贴图，还支持基于物理的渲染（PBR），并能对此前生成的 3D 内容重新再生成新纹理。IT之家援引论文主要内容，Meta 3D Gen 包含 text-to-3D 生成和 text-to-texture 生成两个主要组件，其工作原理如下：第

7/3/2024 10:47:25 AM

故渊

涵盖文本、定位和分割任务，智源、港中文联合提出首个多功能3D医学多模态大模型

作者 | 香港中文大学白帆编辑 | ScienceAI近日，香港中文大学和智源联合提出的 M3D 系列工作，包括 M3D-Data, M3D-LaMed 和 M3D-Bench，从数据集、模型和测评全方面推动 3D 医学图像分析的发展。（1）M3D-Data 是目前最大的 3D 医学图像数据集，包括 M3D-Cap (120K 3D 图文对), M3D-VQA (510K 问答对)，M3D-Seg（150K 3D Mask），M3D-RefSeg (3K 推理分割)共四个子数据集。（2）M3D-LaMed 是目前最

6/21/2024 6:08:00 PM

ScienceAI

CVPR 2024全部奖项公布！近万人线下参会，谷歌华人研究员获最佳论文奖

北京时间 6 月 20 日凌晨，在西雅图举办的国际计算机视觉顶会 CVPR 2024 正式公布了最佳论文等奖项。今年共有 10 篇论文获奖，其中 2 篇最佳论文，2 篇最佳学生论文，另外还有 2 篇最佳论文提名和 4 篇最佳学生论文提名。作为计算机视觉（CV）领域的顶级会议，CVPR 每年都会吸引大量研究机构和高校参会。据统计，今年共提交了 11532 份论文，2719 篇被接收，录用率为 23.6%。根据佐治亚理工学院对 CVPR 2024 录用数据的统计分析，从研究主题来看，论文数量最多的是图像和视频合成与生成

6/20/2024 2:56:00 PM

机器之心

可控核聚变新里程碑，AI首次实现双托卡马克3D场全自动优化，登Nature子刊

编辑 | X几十年来，核聚变释放能量的「精妙」过程一直吸引着科学家们的研究兴趣。现在，在普林斯顿等离子体物理实验室（PPPL）中，科学家正借助人工智能，来解决人类面临的紧迫挑战：通过聚变等离子体产生清洁、可靠的能源。与传统的计算机代码不同，机器学习不仅仅是指令列表，它可以分析数据、推断特征之间的关系、从新知识中学习并适应。PPPL 研究人员相信，这种学习和适应能力可以通过多种方式改善他们对聚变反应的控制。这包括完善超热等离子体周围容器的设计、优化加热方法以及在越来越长的时间内保持反应的稳定控制。近日，PPPL 的

5/22/2024 7:20:00 PM

ScienceAI

三维设计巨头 Autodesk 收购 AI 视效创企 Wonder Dynamics

Autodesk 宣布已收购 Wonder Dynamics，两家公司曾一直有密切合作。据悉 Wonder Dynamics 作为一家初创公司，旗下的 Wonder Studio 是一款融合云技术与人工智能（AI）的 3D 动画和视觉特效创作工具，并与 Autodesk Maya 等其他主流的 3D 设计工具高度兼容，帮助艺术家更轻松地在场景中制作 3D 角色动画、灯光和构图。IT之家查询获悉，Wonder Dynamics 由视觉特效艺术家 Nikola Todorovic 和演员 Tye Sheridan 创立

5/22/2024 11:38:26 AM

满河（实习）

文生图 AI 巨头 Stability AI 被曝欠下近 1 亿美元，正与投资者洽谈融资事宜

综合路透社、The Information 消息，被视为文生图 AI 领域“巨头”之一的英国人工智能初创公司 Stability AI 发言人表示，该公司正与一批投资者洽谈大额股权融资事宜，以为当前资金短缺的 Stability AI 注入新的资金。该发言人表示，Stability AI 正与一家“世界知名的”技术投资集团进行独家合作。报道称，Stability AI 公司第一季度的收入不到 500 万美元（IT之家备注：当前约 3610 万元人民币），亏损超过 3000 万美元（当前约 2.17 亿元人民币），目

5/17/2024 8:12:25 PM

清源

李飞飞揭秘创业方向“空间智能”：视觉化为洞察，看见成为理解，理解导致行动

斯坦福李飞飞创业后，首次揭秘新概念“空间智能”。这不仅是她的创业方向，也是指引她的“北极星”，被她认为是“解决人工智能难题的关键拼图”。视觉化为洞察；看见成为理解；理解导致行动。李飞飞最新 15 分钟 TED 演讲完整公开，从数亿年前生命进化的起源开始，到人类如何不满足于自然赋予而发展人工智能，到下一步如何构建空间智能。而 9 年前，正是在同一个舞台上，李飞飞向世界介绍了刚诞生不久的 ImageNet—— 这一轮深度学习爆发的起点之一。她本人也向网友自我安利：如果把两个视频都看了，你就能对过去 10 年的计算机视觉

5/16/2024 11:36:37 PM

清源

一部手机就能玩出这种特效，难怪3D建模大神都点赞

机器之能报道编辑：Sia手机做的特效，居然也能骗过我的眼睛。这是一组让人怀疑双眼和大脑的视频，我打赌很多人很难分辨哪些东西是假的......视频链接：，哪些是真实的物理存在，哪些是添加的 3D 模型？机器人跑酷时，手足与长凳交互的方式近乎无缝甚至还有熟悉的机械声（记得打开音量），是不是感觉很逼真？就连日本 3D 建模大神 Hirokazu Yokohara 也加入了体验行列。她只花了几分钟就将一个四足机器人模型植入到真实场景中。来自@Yokohara_h视频链接：（你相信吗？）。通过一个叫 Simulon 的苹果

5/8/2024 7:17:00 PM

机器之能

优于SOTA，腾讯AI Lab开发双重扩散模型，实现靶标配体3D分子生成和先导化合物优化

编辑 | 萝卜皮基于结构的生成化学，通过探索广阔的化学空间来设计对靶标具有高结合亲和力的配体，在计算机辅助药物发现中至关重要。然而，传统的计算机方法受到计算效率低下的限制，机器学习方法则因自回归采样而面临瓶颈。为了解决这些问题，腾讯 AI lab、香港城市大学、锐格医药（Regor Therapeutics Group）的研究人员开发了一种条件深度生成模型 PMDM，用于生成适合特定靶标的 3D 分子。PMDM 由具有局部和全局分子动力学的条件等变扩散模型组成，使 PMDM 能够考虑条件蛋白质信息从而有效地生成分子

3/29/2024 6:15:00 PM

ScienceAI

准确率 >98%，基于电子密度的 GPT 用于化学研究，登 Nature 子刊

编辑 | 紫罗可合成的分子化学空间是巨大的。要想有效地驾驭这一领域，需要基于计算的筛选技术，如深度学习技术，以快速跟踪感兴趣的化合物发现。然而，使用算法进行化学发现需要将分子结构转换为计算机可用的数字表示形式，并开发基于这些表示形式的算法来生成新的分子结构。近日，来自英国格拉斯哥大学（University of Glasgow）的研究人员，提出了一种基于电子密度训练的机器学习模型，用于生产主客体 binders。这些以简化分子线性输入规范 (SMILES) 格式读出，准确率 98%，从而能够在二维上对分子进行完整的

3/26/2024 3:12:00 PM

ScienceAI

Meta 推出 SceneScript AI 视觉模型，利用可编程语言实时预测建立 3D 场景

据 Meta 公司官方新闻稿，该公司开发了一款名为“SceneScript”的视觉模型，该模型号称能够使用可编程语言来快速“建立”场景，实时推断房间几何形状，并将相关数据转换为建筑学层面的近似值。▲ 图源 Meta 公司官方新闻稿（下同）Meta 声称，相关方法能够高效且轻量地建立室内 3D 模型，号称“只需要数 KB 的内存即可生成清晰且完整的几何形状”，并且相关形状数据具有“可解释性”，用户可以轻松阅读和编辑这些数据表示。IT之家注意到，开发人员借鉴了大语言模型“预测单词”的方法来开发 SceneScript，

3/25/2024 10:08:44 PM

漾仔

WorldGPT来了：打造类Sora视频AI智能体，「复活」图文

前Meta首席工程负责人胡鲁辉带领Seeking AI携手哈佛、斯坦福、北大等知名学府推出WorldGPT，实现静态内容与动态视频的高度融合

3/21/2024 4:51:00 PM

机器之心

3D城市自动生成方案升级，腾讯GiiNEX游戏AI引擎正式亮相

3月20日，在2024全球游戏开发者大会（GDC）上，腾讯发布了自研游戏AI引擎——GiiNEX。基于生成式AI和决策AI技术，GiiNEX将为游戏全生命周期提供丰富的AI解决方案。借助大模型等生成式AI技术，GiiNEX面向AI NPC、场景制作、内容生成等场景，提供了包括2D图像、动画、3D城市、剧情、对话、关卡以及音乐等多样化的AIGC能力，帮助开发者提升高质量内容生成的效率。同时，GiiNEX也将决策AI技术用于游戏研发测试、模拟玩法等场景，加速游戏创新迭代，以快速适应玩家个性化需求和多变的市场趋势。在会上

3/21/2024 3:15:00 PM

新闻助手

可从单张图像创建多视图 3D 视频，Stability AI 发布 Stable Video 3D 模型

Stability AI 近日发布了 Stable Video 3D 模型，该模型可从单张图像创建多视图 3D 视频。▲ 图源 Stability AI，下同Stable Video 3D 包含两个变体，其中 SV3D_u 能基于单个图像输入生成轨道视频，无需相机调节；而 SV3D_p 扩展了 SVD3_u 的功能，其可容纳轨道视图，允许沿着指定的摄像机路径创建 3D 视频。相较之前的 Stable Zero123 模型或开源替代品 Zero123-XL，Stable Video 3D 在质量上有明显提高，并具有更

3/21/2024 10:53:01 AM

溯波（实习）

Stability AI 开源上新：3D 生成引入视频扩散模型，质量一致性 up，4090 可玩

Stable Diffusion 背后公司 Stability AI 又上新了。这次带来的是图生 3D 方面的新进展：基于 Stable Video Diffusion 的 Stable Video 3D（SV3D），只用一张图片就能生成高质量 3D 网格。Stable Video Diffusion（SVD）是 Stability AI 此前推出的高分辨率视频生成模型。也就是说，此番登场的 SV3D 首次将视频扩散模型应用到了 3D 生成领域。官方表示，基于此，SV3D 大大提高了 3D 生成的质量和视图一致性。

3/19/2024 4:07:19 PM

清源

3D版Midjourney来了？Luma AI发布Genie 1.0，生成手办只需10秒

机器之心报道机器之心编辑部文生 3D 模型又来新玩家。随着生成式 AI 的浪潮席卷而来，科技公司都在冲击 AIGC 的下一个突破口 —— 3D 生成。目前，文生 3D 在学术界取得了许多新突破。在产业界，无论是像英伟达这样的行业巨头，还是像 Stability AI 这样的中坚力量，都推出了自己的文生 3D 工具。虽然 3D 生成领域一直「卷」到飞起，但是好像一直没有出现一款效果足够惊艳，生成速度足够快的代表性产品。如今，一直致力于 3D 内容生产的 Luma AI 向这一领域发起了挑战。就在昨天，Luma AI

1/15/2024 10:10:00 AM

机器之能

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练