3D

3个月估值10亿,李飞飞空间智能首个模型诞生!一张图生成3D世界,视频游戏要变天

AI生成3D世界成真了! 就在刚刚,AI教母李飞飞创立的World Labs首次官宣「空间智能」模型,一张图,即可生成一个3D世界。 用李飞飞的话说,「无论怎样理论化这个想法,都很难用语言描述一张照片或一句话生成3D场景的互动体验。

李飞飞「世界实验室」重磅推出 AI“造物主”:一张图片生成 3D 世界“任意门”

刚刚斯坦福大学的李飞飞教授宣布,她带领的World Labs团队推出一个能从单张图片生成 3D 世界的 AI 系统! 不是简单的 3D 建模,而是真正可以交互的 3D 物理场景! 3D场景在浏览器里就能实时渲染,还能用WASD键和鼠标自由控制视角,就像玩游戏一样!

准确、快速地从头预测RNA 3D结构,港中大、复旦等深度学习方法RhoFold+登Nature子刊

编辑 | KXRNA 分子在分子生物学中心法则中起关键作用,RNA 结构如何影响基因调控和功能一直是研究的热门话题。 准确预测 RNA 三维 (3D) 结构仍是一个难题。 RNA 的结构灵活性导致实验确定的数据稀缺,从而使计算预测工作变得复杂。

Babylon.js:如何与3D场景中的物体交互?

图片开发棋类游戏,需要实现鼠标控制棋子的功能,使得游戏能够将鼠标在屏幕上的位置准确地映射到棋盘上的对应落子点。 如果开发的是2D游戏的话,实现就比较简单,鼠标屏幕坐标和棋盘都是二维平面。 就像下图围棋所示,可以根据xy坐标表示鼠标的位置,同时围棋落子点的坐标也可以计算得出xy坐标,这样很轻松地就能实现鼠标位置和围棋落子点坐标的映射和距离比较。

AI解锁500多年的圣殿,米开朗基罗杰作,你我触手可及

AI好好用报道编辑:Sia有了AI ,咱就更能理解什么是:条条大路通罗马。 活久见!就连世界六分之一人口的信仰中心、「文化瑰宝」——梵蒂冈也开始 AI 了 ! 要知道,教皇弗朗西斯一直呼吁警惕人工智能风险,本人也被 AI 恶搞过。

腾讯混元宣布大语言模型和3D模型正式开源 ​

腾讯混元大模型正在加快开源步伐。 11月5日,腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。 本次开源是腾讯混元继文生图模型后持续开放的一大举措。

腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型

腾讯混元今日开源了 Hunyuan3D-1.0 大模型,官方称这是首个同时支持文生和图生的 3D 开源大模型。 ▲ 文生模型▲ 图生模型模型采用两阶段生成方法,官方表示在保证质量和可控的基础上,10 秒即可生成 3D 资产:第一阶段,团队采用了一种多视角扩散模型,轻量版模型能够在大约 4 秒内生成多视角图像。 这些多视角图像从不同的视角捕捉了 3D 资产的丰富的纹理和几何先验,将任务从单视角重建松弛到多视角重建第二阶段,团队引入了一种前馈重建模型,利用上一阶段生成的多视角图像。

索尼 PlayStation 将使用更多 AI 技术,实现游戏开发降本增效

据 Insider Gaming 28 日报道,在索尼公司本月发布的《2024 年企业报告》中,索尼提出了未来的愿景 —— 要成为一家适应社会变革和技术发展的娱乐公司,AI 和机器学习将在 PlayStation 发挥核心作用,尤其是在游戏领域。报告举例说,在《漫威蜘蛛侠 2》的制作过程中,工作人员就使用了语音识别软件来自动同步字幕和人物对话,大大缩短了开发过程。据了解,索尼的目标是在不影响质量的前提下加快流程、降低成本,为此还计划将实时 3D 处理和传感器技术等技术整合到游戏开发中。“今后,我们计划在集团内跨职能

单图就能解锁全景视角,北大 / 港中文 / 腾讯等推出 ViewCrafter 开源项目

随便给张图就能从更多视角查看全景了?!话不多说,先看一波效果,单视角输入 be like:难度升级,接下来换成双视角,看起来衔接也非常丝滑。以上来自 ViewCrafter,由北大、港中文、腾讯等机构的研究人员提出,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生 3D、图生 3D、以及稀疏视角重建等应用。目前论文和代码均已开源,并提供了在线 Huggingface demo 供用户使用。ViewCrafter:一种新视角生成方法传统的新视角生成方法,如 NeRF 和 3D-GS 等技术,存在

为吸引开发者创建游戏地图,“元宇宙平台”Roblox 将推出 3D 模型生成 AI 工具

《Roblox(罗布乐思)》是一个深受孩子们欢迎的社区游戏平台,也是一款“知名元宇宙游戏”, 玩家可以自行为这款游戏(平台)上传一系列场景脚本,从而能够在游戏(平台)中,使用同一角色游玩到各种各样的游戏内容。该平台在上周的开发者大会中宣布将提高游戏创作者的分成比例,并在游戏中集成(实体商品销售)电商平台。此外,Roblox 还将推出基于 AI 的 3D 模型生成工具以吸引开发者创建游戏地图。▲ Roblox 在开发者大会上演示的 AI 生成地区建模效果(下同)Roblox 指出,全球约有 34 亿人玩游戏,游戏产业

元象推出国内首个基于物理的3D动作生成模型MotionGen

www.MotionGen.cn 一句话生成复杂3D动作,效果惊艳!测试期可申请免费试用。3D内容制作领域,生成逼真的角色动作生成是一个持续挑战,传统方法依赖大量的手K制作,或昂贵动作捕捉设备,效率低、成本高、难以生成一般运动任务或适应复杂场景和交互。元象XVERSE推出国内首个基于物理的3D动作生成模型MotionGen,创新性融合大模型、物理仿真和强化学习等前沿算法,让用户输入简单文本指令,就能快速生成逼真、流畅、复杂的3D动作,效果惊艳,标志着中国3D AIGC领域的重大突破。现在起,零经验创作者也能轻松上手

智谱 AI 开源 CogVideoX-5B 视频生成模型,RTX 3060 显卡可运行

智谱 AI 开源了 CogVideoX-5B 视频生成模型,相比此前开源的 CogVideoX-2B,官方称其视频生成质量更高,视觉效果更好。官方表示大幅度优化了模型的推理性能,推理门槛大幅降低,可以在 GTX 1080Ti 等早期显卡运行 CogVideoX-2B ,在 RTX 3060 等桌面端“甜品卡”运行 CogVideoX-5B 模型。CogVideoX 是一个大规模 DiT(diffusion transformer)模型,用于文本生成视频任务,主要采用了以下技术:3D causal VAE:通过压缩视

第二波!2024年8月精选实用设计工具合集

大家好,这是 2024 年 8 月的第 2 波干货合集! 在搜集整理 3D 工具的时候,我注意到 2 个对于设计师非常友好的 3D 工具,其中一个是更加适宜新手入坑 3D 的建模平台 Womp3D,以及可以帮助前端快速将 3D 资源插入到网页中的代码工具,这俩在网页前端设计落地的过程中,甚至可以直接联动起来。 而 AI 工具这边,这期搜集到了 3 个非常值得关注的好东西,一个是阿里出品的开源的 AI 自动剪辑工具,对于做影视的小伙伴会非常友好,另外 2 个则和 UI 设计落地有关的 AI 平台,它们甚至隐约呈现出了

一张图即可 0.5 秒生成三维建模,Stability AI 推出“Stable Fast 3D”模型

Stability AI 今天推出了一款名为 Stable Fast 3D 的 AI 模型,该模型主打“图生 3D 模型”,号称只需 0.5 秒就能快速生成完整且自然的 3D 模型,目前该模型已在 Hugging Face 平台上架,感兴趣的小伙伴们可以(点此访问)。AI在线获悉,Stable Fast 3D 只需要单张图片即可快速生成高质量的 3D 模型,相关模型自带材质及对应的参数,同时提供了精确的 UV 展开(UV Unwrapping)便于用户进行后期修改,如果用户需要,还可以选择四边形或三角形网格重建功能

智加科技论文DualBEV入选计算机视觉顶会ECCV

近日,智加科技团队论文《DualBEV: Unifying Dual Veiw Transformation with Probabilistic Correspondences》入选欧洲计算机视觉国际会议(ECCV, European Conference on Computer Vision),ECCV是计算机视觉领域最具影响力和权威性的国际会议之一,与国际计算机视觉大会(ICCV)和计算机视觉与模式识别会议(CVPR)齐名,被誉为计算机视觉领域的“三大顶会”之一。ECCV 每两年举办一次,汇聚了全球顶尖的研究

Meta 发布 3D Gen AI 模型:1 分钟内生成高质量 3D 内容

Meta 公司昨日(7 月 2 日)发布研究论文,介绍了名为 Meta 3D Gen(3DGen)的全新 AI 模型,可以在 1 分钟内基于用户输入的提示词,生成高质量的 3D 内容。Meta 公司表示 Meta 3D Gen(3DGen)所生成的 3D 内容具备高分辨率纹理和材质贴图,还支持基于物理的渲染(PBR),并能对此前生成的 3D 内容重新再生成新纹理。IT之家援引论文主要内容,Meta 3D Gen 包含 text-to-3D 生成和 text-to-texture 生成两个主要组件,其工作原理如下:第

涵盖文本、定位和分割任务,智源、港中文联合提出首个多功能3D医学多模态大模型

作者 | 香港中文大学白帆编辑 | ScienceAI近日,香港中文大学和智源联合提出的 M3D 系列工作,包括 M3D-Data, M3D-LaMed 和 M3D-Bench,从数据集、模型和测评全方面推动 3D 医学图像分析的发展。(1)M3D-Data 是目前最大的 3D 医学图像数据集,包括 M3D-Cap (120K 3D 图文对), M3D-VQA (510K 问答对),M3D-Seg(150K 3D Mask),M3D-RefSeg (3K 推理分割)共四个子数据集。(2)M3D-LaMed 是目前最

CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖

北京时间 6 月 20 日凌晨,在西雅图举办的国际计算机视觉顶会 CVPR 2024 正式公布了最佳论文等奖项。今年共有 10 篇论文获奖,其中 2 篇最佳论文,2 篇最佳学生论文,另外还有 2 篇最佳论文提名和 4 篇最佳学生论文提名。作为计算机视觉(CV)领域的顶级会议,CVPR 每年都会吸引大量研究机构和高校参会。据统计,今年共提交了 11532 份论文,2719 篇被接收,录用率为 23.6%。根据佐治亚理工学院对 CVPR 2024 录用数据的统计分析,从研究主题来看,论文数量最多的是图像和视频合成与生成