模型

一个算法让LLM创新能力暴增，原来是AI学会了进化

如果你让当今的 LLM 给你生成一个创意时钟设计，使用提示词「a creative time display」，它可能会给出这样的结果：或许我们能在其中看到一些创新点，但整体来说这些设计并无特别出彩之处，依然还在预期之内。但近日的一项研究成果却可以让 LLM 设计出下面这些让人眼前一亮的时钟，而使用的提示词却和上面的一样：这是怎么做到的呢？简而言之：一种基于 LLM 的进化算法。

3/20/2025 2:18:57 PM

机器之心

生活机器人最后考验！杨笛一团队发布EgoNormia：现实中能否符合社会规范？

随着人工智能技术日益成熟，社会各界对AI或机器人能否学习并遵循社会规范的问题越来越关注。从早期的科幻小说到如今的现实应用，人类始终期望机器能够理解并内化这些根植于社会生活中的「规范」。随着视觉语言模型（VLMs）不断进步，研究者们陆续推出了诸多基准和数据集，用以评估其第一视角下的视频理解能力。

3/20/2025 1:02:34 PM

新智元

宇树机器人侧空翻惊呆网友：“我**想要一个！”

这下特效视频和机器人实拍真的傻傻分不清楚了…前几天机器人卷的还是前后空翻呢，宇树现在连侧空翻都曝出来了。干拔起跳，落地都不带晃的：以上动作，由宇树的Unitree G1呈现，就是身高1米3，售价9.9万起的那个型号。宇树官方是酱婶描述的：这是世界上第一款征服站立侧空翻的人形机器人。

3/20/2025 12:11:42 PM

量子位

OpenAI史上最贵模型来了！比DeepSeek贵270倍，100万输出token 600美元

比DeepSeek-R1贵270倍，OpenAI史上最贵模型来了！就在刚刚，OpenAI上线了推理模型o1-pro的API。本来大家还挺高兴，结果一看到价格，悬着的心终于死了。

3/20/2025 11:58:29 AM

波士顿动力Atlas逆天进化！这次用上了「强化学习+动捕」，人类动作直接复刻，背后还有个AI机构

说起波士顿动力，大家肯定不陌生，他们家的Atlas机器人，也是人形机器人界的“顶流”。刚刚，Atlas人形机器人又秀了一波新操作，简直太惊人了，动作无限接近人类，大家直接看视频感受一下波士顿动力官方发推表示，Atlas这次展示的是用动作捕捉服开发的强化学习策略。啥意思呢？

3/20/2025 10:30:35 AM

AI寒武纪

AI预判了你的预判！人大高瓴团队发布TTR，教会AI一眼看穿你的下一步

本文作者均来自中国人民大学高瓴人工智能学院。其中，第一作者谭文辉是人大高瓴博士生（导师：宋睿华长聘副教授），他的研究兴趣主要在多模态与具身智能。本文通讯作者为宋睿华长聘副教授，她的团队 AIMind 主要研究方向为多模态感知、生成与交互。

3/20/2025 10:03:44 AM

机器之心

刚刚，OpenAI推出最贵o1-pro API！千倍于DeepSeek

刚刚，OpenAI 在其开发者 API 中推出了 o1 推理模型的一个更强大版本，即 o1-pro。据 OpenAI 称，o1-pro 使用比 o1 更多的计算资源来提供更好的响应。该功能仅对特定开发者开放（Tier 1–5 开发者），支持视觉、函数调用、结构化输出，并与响应和 Batch API 兼容。

3/20/2025 9:46:06 AM

机器之心

揭秘老黄演讲中关键技术：PD分离！UCSD华人团队力作，LLM吞吐量跃升4倍

现在，PD分离已经成为兵家必争之地。前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务，后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。甚至最近，黄仁勋也在2025 GTC的舞台上提到了PD分离（Prefill-Decode Disaggregation）技术，进一步证明了这一技术获得的广泛关注。

3/20/2025 9:00:00 AM

新智元

1段视频=亿万虚拟场景，当真实世界秒变机器人训练场

3月19日，群核科技在GTC2025全球大会上宣布开源空间理解模型SpatialLM，这是一个基于大语言模型的3D场景语义生成框架。它突破了传统大语言模型对物理世界几何与空间关系的理解局限，赋予机器类似人类的空间认知和解析能力。这相当于为具身智能领域提供了一个基础的空间理解训练框架，企业可以针对特定场景对SpatialLM模型微调，降低具身智能训练门槛。

3/19/2025 2:47:00 PM

新闻助手

无需百卡集群！港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

LightGen 主要作者来自香港科技大学和 Everlyn AI, 第一作者为香港科技大学准博士生吴显峰，主要研究方向为生成式人工智能和 AI4Science。通讯作者为香港科技大学助理教授 Harry Yang 和中佛罗里达副教授 Sernam Lim。共同一作有香港科技大学访问学生白亚靖，香港科技大学博士生郑皓泽，Everlyn AI 实习生陈浩东，香港科技大学博士生刘业鑫。

3/19/2025 10:41:11 AM

机器之心

世界模型在机器人任务规划中的全新范式：NUS邵林团队提出通用机器人规划模型FLIP

本文的作者均来自新加坡国立大学 LinS Lab。本文第一作者为新加坡国立大学博士生高崇凯，其余作者为北京大学实习生张浩卓，新加坡国立大学博士生徐志轩，新加坡国立大学硕士生蔡哲豪。本文的通讯作者为新加坡国立大学助理教授邵林。

3/19/2025 10:26:10 AM

机器之心

Django创造者Simon Willison分享：我如何使用LLM帮我写代码

近段时间，著名 AI 科学家 Andrej Karpathy 提出的氛围编程（vibe coding）是 AI 领域的一大热门话题。简单来说，氛围编程就是鼓励开发者忘掉代码，进入开发的氛围之中。更简单地讲，就是向 LLM 提出需求，然后「全部接受」即可。

3/19/2025 10:19:22 AM

机器之心

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

皮衣老黄，带着最强AI芯片GB300闪亮登场“AI超级碗”GTC，燃爆全场！性能方面，和去年发布的GB200相比，推理性能是其1.5倍。据悉，GB300将在今年的下半年出货。

3/19/2025 9:52:50 AM

量子位

AI真·抢饭碗？美国码农就业跌至1980年以来最低，重回「吃豆人」时代

美国程序员的就业人数已跌至1980年以来的最低水平!那可是互联网存在之前的好多年了。 1980年，「吃豆人」（Pac-Man）游戏刚刚风靡全球。亚马逊还没开始在线上卖货，苹果还没有出售它的iPhone。

3/19/2025 9:30:10 AM

新智元

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

刚刚，昆仑万维正式开源了全球首个工业界多模态推理模型Skywork R1V（以下简称「R1V」）！ R1V高效地将DeepSeek-R1这种强大的文本推理能力无缝scaling到了视觉模态，实现了多模态领域的领先表现，并以开源方式推动了技术进步。由此，多模态推理的新时代即将开启。

3/19/2025 9:20:00 AM

新智元

多模态也做到了强推理！工业界首个开源的R1V，让视觉思考进入o1时代

DeepSeek-R1 问世后，我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。如果能在视觉等各领域复刻强化学习（RL）在文本上的突破，AI 应用势必会将更多领域推入新的范式。毫无疑问，这也是众多科技公司正在探索的方向。

3/19/2025 8:30:00 AM

机器之心

o1/o3后训练负责人离职创业，奥特曼把OpenAI玩成另一个YC孵化器了

OpenAI高管离职潮继续：CTO Mira卷着一票人才集体出走之后，刚刚，后训练研究副总裁William Fedus也官宣离职创业了。他在不到半年前，也就是去年10月刚刚晋升——没错，彼时OpenAI的上一任后训练负责人Barret Zoph等人刚刚跟着CTO Mira跑路。在那一拨人才离职潮中，William (Liam) Fedus是顶上重任的主要角色之一。

3/18/2025 1:14:13 PM

量子位

ChatGPT创始成员、后训练负责人官宣离职！自立门户并将获OpenAI投资

OpenAI 又有重量级员工出走！这次是后训练负责人、研究副总裁 William Fedus。今天凌晨，Fedus 在 X 上发表了一则公开离职信，讲述了他离职的原因以及今后的去向。

3/18/2025 9:26:22 AM

机器之心

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna 纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验 AI视频资讯早读！7个产品更新+8个案例精选 Figma 推 AI 革命：开发智能应用制作器与网站创建工具即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Anthropic Sora 3D AI for Science AI设计机器学习 GPU AI视频开发者场景华为预测百度人形机器人伟达苹果 Transformer 深度学习模态 xAI 大语言模型字节跳动 Claude 搜索驾驶文本具身智能神器推荐 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊训练特斯拉 AGI 2024