AI在线 AI在线

模型

一个算法让LLM创新能力暴增,原来是AI学会了进化

如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果:或许我们能在其中看到一些创新点,但整体来说这些设计并无特别出彩之处,依然还在预期之内。 但近日的一项研究成果却可以让 LLM 设计出下面这些让人眼前一亮的时钟,而使用的提示词却和上面的一样:这是怎么做到的呢? 简而言之:一种基于 LLM 的进化算法。
3/20/2025 2:18:57 PM
机器之心

生活机器人最后考验!杨笛一团队发布EgoNormia:现实中能否符合社会规范?

随着人工智能技术日益成熟,社会各界对AI或机器人能否学习并遵循社会规范的问题越来越关注。 从早期的科幻小说到如今的现实应用,人类始终期望机器能够理解并内化这些根植于社会生活中的「规范」。 随着视觉语言模型(VLMs)不断进步,研究者们陆续推出了诸多基准和数据集,用以评估其第一视角下的视频理解能力。
3/20/2025 1:02:34 PM
新智元

宇树机器人侧空翻惊呆网友:“我**想要一个!”

这下特效视频和机器人实拍真的傻傻分不清楚了…前几天机器人卷的还是前后空翻呢,宇树现在连侧空翻都曝出来了。 干拔起跳,落地都不带晃的:以上动作,由宇树的Unitree G1呈现,就是身高1米3,售价9.9万起的那个型号。 宇树官方是酱婶描述的:这是世界上第一款征服站立侧空翻的人形机器人。
3/20/2025 12:11:42 PM
量子位

OpenAI史上最贵模型来了!比DeepSeek贵270倍,100万输出token 600美元

比DeepSeek-R1贵270倍,OpenAI史上最贵模型来了! 就在刚刚,OpenAI上线了推理模型o1-pro的API。 本来大家还挺高兴,结果一看到价格,悬着的心终于死了。
3/20/2025 11:58:29 AM

波士顿动力Atlas逆天进化!这次用上了「强化学习+动捕」,人类动作直接复刻,背后还有个AI机构

说起波士顿动力,大家肯定不陌生,他们家的Atlas机器人,也是人形机器人界的“顶流”。 刚刚,Atlas人形机器人又秀了一波新操作,简直太惊人了,动作无限接近人类,大家直接看视频感受一下波士顿动力官方发推表示,Atlas这次展示的是用动作捕捉服开发的强化学习策略。 啥意思呢?
3/20/2025 10:30:35 AM
AI寒武纪

AI预判了你的预判!人大高瓴团队发布TTR,教会AI一眼看穿你的下一步

本文作者均来自中国人民大学高瓴人工智能学院。 其中,第一作者谭文辉是人大高瓴博士生(导师:宋睿华长聘副教授),他的研究兴趣主要在多模态与具身智能。 本文通讯作者为宋睿华长聘副教授,她的团队 AIMind 主要研究方向为多模态感知、生成与交互。
3/20/2025 10:03:44 AM
机器之心

刚刚,OpenAI推出最贵o1-pro API!千倍于DeepSeek

刚刚,OpenAI 在其开发者 API 中推出了 o1 推理模型的一个更强大版本,即 o1-pro。 据 OpenAI 称,o1-pro 使用比 o1 更多的计算资源来提供更好的响应。 该功能仅对特定开发者开放(Tier 1–5 开发者),支持视觉、函数调用、结构化输出,并与响应和 Batch API 兼容。
3/20/2025 9:46:06 AM
机器之心

揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍

现在,PD分离已经成为兵家必争之地。 前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务,后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。 甚至最近,黄仁勋也在2025 GTC的舞台上提到了PD分离(Prefill-Decode Disaggregation)技术,进一步证明了这一技术获得的广泛关注。
3/20/2025 9:00:00 AM
新智元

1段视频=亿万虚拟场景,当真实世界秒变机器人训练场

3月19日,群核科技在GTC2025全球大会上宣布开源空间理解模型SpatialLM,这是一个基于大语言模型的3D场景语义生成框架。 它突破了传统大语言模型对物理世界几何与空间关系的理解局限,赋予机器类似人类的空间认知和解析能力。 这相当于为具身智能领域提供了一个基础的空间理解训练框架,企业可以针对特定场景对SpatialLM模型微调,降低具身智能训练门槛。
3/19/2025 2:47:00 PM
新闻助手

无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

LightGen 主要作者来自香港科技大学和 Everlyn AI, 第一作者为香港科技大学准博士生吴显峰,主要研究方向为生成式人工智能和 AI4Science。 通讯作者为香港科技大学助理教授 Harry Yang 和中佛罗里达副教授 Sernam Lim。 共同一作有香港科技大学访问学生白亚靖,香港科技大学博士生郑皓泽,Everlyn AI 实习生陈浩东,香港科技大学博士生刘业鑫。
3/19/2025 10:41:11 AM
机器之心

世界模型在机器人任务规划中的全新范式:NUS邵林团队提出通用机器人规划模型FLIP

本文的作者均来自新加坡国立大学 LinS Lab。 本文第一作者为新加坡国立大学博士生高崇凯,其余作者为北京大学实习生张浩卓,新加坡国立大学博士生徐志轩,新加坡国立大学硕士生蔡哲豪。 本文的通讯作者为新加坡国立大学助理教授邵林。
3/19/2025 10:26:10 AM
机器之心

Django创造者Simon Willison分享:我如何使用LLM帮我写代码

近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领域的一大热门话题。 简单来说,氛围编程就是鼓励开发者忘掉代码,进入开发的氛围之中。 更简单地讲,就是向 LLM 提出需求,然后「全部接受」即可。
3/19/2025 10:19:22 AM
机器之心

老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录

皮衣老黄,带着最强AI芯片GB300闪亮登场“AI超级碗”GTC,燃爆全场! 性能方面,和去年发布的GB200相比,推理性能是其1.5倍。 据悉,GB300将在今年的下半年出货。
3/19/2025 9:52:50 AM
量子位

AI真·抢饭碗?美国码农就业跌至1980年以来最低,重回「吃豆人」时代

美国程序员的就业人数已跌至1980年以来的最低水平!那可是互联网存在之前的好多年了。 1980年,「吃豆人」(Pac-Man)游戏刚刚风靡全球。 亚马逊还没开始在线上卖货,苹果还没有出售它的iPhone。
3/19/2025 9:30:10 AM
新智元

全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开

刚刚,昆仑万维正式开源了全球首个工业界多模态推理模型Skywork R1V(以下简称「R1V」)! R1V高效地将DeepSeek-R1这种强大的文本推理能力无缝scaling到了视觉模态,实现了多模态领域的领先表现,并以开源方式推动了技术进步。 由此,多模态推理的新时代即将开启。
3/19/2025 9:20:00 AM
新智元

多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代

DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。 如果能在视觉等各领域复刻强化学习(RL)在文本上的突破,AI 应用势必会将更多领域推入新的范式。 毫无疑问,这也是众多科技公司正在探索的方向。
3/19/2025 8:30:00 AM
机器之心

o1/o3后训练负责人离职创业,奥特曼把OpenAI玩成另一个YC孵化器了

OpenAI高管离职潮继续:CTO Mira卷着一票人才集体出走之后,刚刚,后训练研究副总裁William Fedus也官宣离职创业了。 他在不到半年前,也就是去年10月刚刚晋升——没错,彼时OpenAI的上一任后训练负责人Barret Zoph等人刚刚跟着CTO Mira跑路。 在那一拨人才离职潮中,William (Liam) Fedus是顶上重任的主要角色之一。
3/18/2025 1:14:13 PM
量子位

ChatGPT创始成员、后训练负责人官宣离职!自立门户并将获OpenAI投资

OpenAI 又有重量级员工出走! 这次是后训练负责人、研究副总裁 William Fedus。 今天凌晨,Fedus 在 X 上发表了一则公开离职信,讲述了他离职的原因以及今后的去向。
3/18/2025 9:26:22 AM
机器之心