空间智能
杭州六小龙群核科技递表港交所,冲击全球空间智能第一股,李飞飞看中的万亿赛道
卷大语言模型毫无意义,实现 AGI 必须另起炉灶,构建具备物理认知的感知学习系统。 这是 Meta 首席 AI 科学家,图灵奖得主 Yann LeCun 最近在巴黎 AI 行动峰会对单语言模态下达的「最后通牒」。 虽然对语言模型的看法不同,这也在一定程度上印证了李飞飞的判断:AI 已经获得了语言智能,但要向 AGI 迈进,必须解锁空间智能的维度。
2/16/2025 5:46:00 PM
logo
昆仑万维发布Matrix-Zero世界模型:国内首创3D场景与可交互视频生成
昆仑万维今日宣布正式推出其Matrix-Zero世界模型,成为国内首家同时具备3D场景生成和可交互视频生成能力的人工智能企业,标志着其在空间智能领域迈出了重要一步。 Matrix-Zero的核心亮点在于其强大的3D场景生成功能。 该功能可以将用户输入的图片转化为具有全局一致性、可自由探索的真实3D场景。
2/14/2025 2:45:00 PM
AI在线
昆仑万维发布Matrix-Zero世界模型 支持3D场景、可交互视频生成
2025年2月14日,昆仑万维集团正式推出Matrix-Zero世界模型,标志着中国在空间智能领域迈出了重要一步。 Matrix-Zero包含两款子模型:3D场景生成大模型和可交互视频生成大模型,旨在通过AI技术重塑数字内容创作模式,推动影视制作、游戏开发、具身智能等行业的创新发展。 Matrix-Zero的3D场景生成大模型能够将用户输入的图片转化为可自由探索的真实3D场景,支持不同风格的图片输入和风格迁移,并具备动态场景生成能力。
2/14/2025 10:16:00 AM
AI在线
李飞飞、谢赛宁等探索MLLM「视觉空间智能」,网友:2025有盼头了
希望 2025 年 AI 领域能带来推理之外的突破。 在购买家具时,我们会尝试回忆起我们的客厅,以想象一个心仪的橱柜是否合适。 虽然估计距离是困难的,但即使只是看过一次,人类也能在脑海里重建空间,回忆起房间里的物体、它们的位置和大小。
12/23/2024 12:59:00 PM
机器之心
李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪
人类的沟通交流充满了多模态的信息。 为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。 因此,为了理解和生成人类动作,理解这些多模态的行为至关重要,而且这一研究方向最近受到的关注也越来越多。
12/18/2024 1:40:00 PM
机器之心
李飞飞:World Labs这样实现「空间智能」
遵循世界的 3D 特性,很多事就会变得自然而然。 说到斯坦福大学教授李飞飞(Fei-Fei Li),她提倡的「空间智能」最近正在引领 AI 发展方向。 李飞飞已经在人工智能历史上赢得了一席之地,她多年来一直致力于创建 ImageNet 数据集和竞赛,在深度学习革命中发挥了重要作用。
12/13/2024 1:36:00 PM
机器之心
AI 靠单图生成 3D 世界:李飞飞空间智能首秀,可像玩游戏一样探索
重点在于,生成的 3D 世界具有交互性。用户能够像玩游戏那样,自由地移动相机来探索这个 3D 世界,浅景深、希区柯克变焦等操作均可行。
12/3/2024 5:21:19 PM
汪淼
刚刚,李飞飞创业首个项目引围观:单图生成交互3D场景,空间智能来了
这是空间智能的第一步。 「无论怎样理论化,我们还是很难用语言来描述与照片或句子生成的 3D 场景交互的体验,」李飞飞说道。 北京时间今天凌晨,著名 AI 学者、斯坦福大学教授李飞飞公布了她的第一个创业项目。
12/3/2024 10:22:00 AM
机器之心
李飞飞任CEO,空间智能公司World Labs亮相,全明星阵容曝光
人工智能的下个大方向已经出现,标志性学者决定下场创业。本周五,一个重磅消息引爆了 AI 圈:斯坦福大学计算机科学家李飞飞正式宣布创办 AI 初创公司 ——World Labs,旨在向人工智能系统传授有关物理现实的深入知识。李飞飞说道:在 AI 领域中,真正难以解决的问题是什么?我的答案是空间智能 —— 这项技术可以赋能和实现创作、设计、学习、AR/VR、机器人等领域的无数可能用例。为此,李飞飞与三位联合创始人 Justin Johnson、Christoph Lassner、Ben Mildenhall,以及一支世
9/14/2024 1:08:00 PM
机器之心
想搞懂李飞飞的创业方向?这里有一份机器人+3D的论文清单
80 多篇论文搞懂「机器人 3D」研究进展。前段时间,多家媒体报道称 ,著名 AI 学者、斯坦福大学教授李飞飞的创业公司 World Labs 在短短三个月内已经完成了两轮融资,其中最新一轮融资中筹到了约 1 亿美元,公司估值已超过 10 亿美元,成为新晋独角兽。World Labs 的发展方向聚焦于「空间智能」,即开发能够理解三维物理世界的模型,模拟物体的物理特性、空间位置和功能。李飞飞认为「空间智能」是 AI 发展的关键一环,她的团队正在斯坦福大学实验室里训练计算机和机器人在三维世界中采取行动,例如使用大型语言
8/16/2024 2:24:00 PM
机器之心
李飞飞亲自撰文:大模型不存在主观感觉能力,多少亿参数都不行
归根结底,大模型的方向还是走错了?「空间智能是人工智能拼图中的关键一环。」知名「AI 教母」李飞飞曾这样表示。近段时间,李飞飞开始把目光瞄准到这一领域,并为此创建了一家初创公司。她曾表示,「大自然创造了一个以空间智能为动力的观察和行动的良性循环。」她所在的斯坦福大学实验室正在尝试教计算机「如何在三维世界中行动」,例如,使用大型语言模型让一个机械臂根据口头指令执行开门、做三明治等任务。我们不难看出,李飞飞口中的空间智能也有大模型的参与。如今,随着技术的发展,LLM 在多个方面表现出超人类智能。然而关于 LLM 的争议
5/24/2024 3:19:00 PM
机器之心
李飞飞「空间智能」系列新进展,吴佳俊团队新「BVS」套件评估计算机视觉模型
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]在不久之前的 2024 TED 演讲中,李飞飞详细解读了 空间智能(Spatial Intelligence)概念。她对计算机视觉领域在数年间的快速发展感到欣喜并抱有极大热忱,并为此正在创
5/21/2024 5:42:00 PM
机器之心
李飞飞解读创业方向「空间智能」,让AI真正理解世界
李飞飞创业选择的「空间智能」,完整的 TED 解读视频公布了。前段时间,路透社独家报道了知名「AI 教母」李飞飞正在创建一家初创公司,并完成了种子轮融资。在介绍这家初创公司时,一位消息人士引用了李飞飞在温哥华 TED 上的一次演讲,表示她在此次 TED 演讲中介绍了空间智能的概念。就在今天,李飞飞在 X 上放出了她在温哥华 TED 上的完整演讲视频。她在 X 上介绍称,「空间智能是人工智能拼图中的关键一环。这是我 2024 年有关从进化到人工智能历程的 TED 演讲,也涉及到我们如何构建空间智能。从看到变为洞察,洞
5/16/2024 2:51:00 PM
机器之心
斯坦福李飞飞首次创业:学术休假两年,瞄准「空间智能」
「AI 教母」李飞飞创业了。没想到,在大模型时代,知名「AI 教母」李飞飞也要「创业」了,并完成了种子轮融资。据路透社独家报道,著名计算机科学家李飞飞正在创建一家初创公司。该公司利用类似人类的视觉数据处理方式,使人工智能能够进行高级推理。知情人士透露称,李飞飞最近为这家公司进行了种子轮融资,投资者包括硅谷风险投资公司 Andreessen Horowitz,以及她去年加入的加拿大公司 Radical Ventures。不过,Andreessen Horowitz 和 Radical Ventures 的发言人均对此
5/5/2024 10:41:00 AM
机器之心
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
Haisnap横空出世,小白用户也能轻松打造AI应用
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
本地部署DeepSeek+DiFy平台构建智能体应用
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
ChatGPT重磅更新:新增图像库功能,可查看自己用GPT生成的所有图片
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练