基础

千寻位置免费开放时空智能三体套件，加速具身机器人全域全场景

4月9日，千寻位置正式发布机器人时空智能三体开发套件SpatiX （简称“时空智能三体套件”），助力机器人企业降低研发门槛、提升研发效率。目前，千寻位置已与多家知名具身智能头部企业合作，共同推进具身智能等未来产业的商业化落地。即日起，机器人研发、生产或集成应用的企业以及相关科研机构均可通过免费体验活动申请试用，获得专属服务。

4/11/2025 10:07:00 AM

新闻助手

在人工智能飞速发展的今天，LLM 的能力令人叹为观止，但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」，无法直接触及实时信息或外部工具。 2024 年 11 月，Anthropic 推出了开源协议 MCP（Model Context Protocol，模型上下文协议），旨在为 AI 模型与外部数据源和工具之间的交互提供一个通用、标准化的连接方式。 MCP 的开源性质也迅速吸引了开发社区的关注，许多人将其视为 AI 生态系统标准化的重要一步。

4/6/2025 10:14:00 AM

机器之心

硅基战队来袭，联想中国誓师大会宣布智能体矩阵已成

联想将再一次以 AI 服务加速中国千行百业、千家万户快速踏入 AI 应用之门。

4/1/2025 5:36:00 PM

机器之心

维他动力种子轮融资2亿元，今年底发布首款消费级机器人产品

明星机器人产品公司——维他动力（Vita Dynamics）近期完成了种子轮融资，成立三个月内，累计完成2亿元种子轮融资，本轮融资由知名投资机构今日资本、凯辉基金领投，雅瑞资本参与投资，高瓴创投、元璟资本、初心资本、柏睿资本及BV百度风投等多家首轮投资方持续跟投，高鹄资本担任独家财务顾问。此次融资将进一步加速维他动力为个人和家庭创造生活空间智能伙伴的产品研发与市场拓展。在技术突破和应用场景的双重驱动下，机器人产业化进程已经迎来重大机遇。

3/21/2025 11:27:00 AM

新闻助手

不是CG？没加速？这个国产机器人跳「斧头帮」舞火了，网友：流畅到不像真的

机器之心报道，编辑：张倩、佳琳。

3/17/2025 2:19:00 PM

机器之心

加速精准医疗，开源GNN实现分子精准建模，质谱识别准确率提升至49%

编辑丨&非靶向代谢组学在推进精准医学和生物标志物发现方面前景广阔。由于谱图参比库的不完整，从串联质谱中鉴定化合物在当前仍是一项颇有挑战的任务。为了应对这项挑战，德国联邦材料研究与测试研究所（BAM）与柏林自由大学的一支团队提出了 FIORA，这是一种旨在模拟串联质谱的开源图神经网络。

3/12/2025 12:03:00 PM

ScienceAI

华为昇腾适配阶跃星辰Step-Video和Step-Audio开源大模型，上线魔乐社区

今日，魔乐社区（Modelers）宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型，并基于华为昇腾 CANN 异构计算架构和昇腾服务器，完成了对模型的适配。开发者和企业用户在魔乐社区中可以直接下载并体验。 Step-Video-T2V 是目前全球参数量最大的开源视频生成模型，达到300亿参数。

3/10/2025 3:10:00 PM

新闻助手

OmniParser V2 在 Windows 系统上的详细安装与运行指南

3/10/2025 12:26:20 PM

AI在线

Nature子刊 | 光镜电镜通用，Meta「分割一切」模型用到显微镜图像上了

编辑丨coisini识别显微镜图像中的对象，例如光学显微镜（LM）下的细胞和细胞核是生物学图像分析中的关键任务之一。由于显微镜成像方式的多样性和不同维度（二维 / 三维，时间维度）的存在，这些识别任务具有挑战性，目前需要采用不同的方法来解决。基于深度学习的方法在过去几年中显著改善了 LM 下的细胞和细胞核分割，电子显微镜（EM）下的细胞、神经元和细胞器分割。

3/7/2025 1:14:00 PM

ScienceAI

11天实现18种广谱抗菌素设计，体外验证成功率94.4%，浙大侯廷军等用LLM方法从头设计AMP

编辑 | 萝卜皮大型语言模型 (LLM) 在化学和生物医学研究中取得了显著进展，可作为各种任务的多功能基础模型。浙江大学侯廷军、谢昌谕以及南方医科大学姜志辉等课题组组成的联合团队提出了 AMP-Designer，这是一种基于 LLM 的方法，用于快速设计具有所需特性的抗菌肽 (AMP)。在 11 天内，AMP-Designer 实现了 18 种具有广谱抗革兰氏阴性细菌活性的 AMP 的从头设计。

3/7/2025 1:11:00 PM

ScienceAI

多中心医学图像分析模型，VFMGL框架破解数据孤岛难题，93.4% Dice系数的卓越表现

编辑丨&在众多中下游任务中，收到广泛而多样的数据集训练的基础模型表现出的强大性能，在医疗领域表现却不甚得人心。受到到数据量、异质性和隐私问题等问题的严重阻碍，基础模型得不到更进一步的发展。桂林航空航天大学联合江门市中心医院等推出了 Vision Foundation Model General Lightweight（VFMGL）框架，以促进各种医疗任务的专家临床模型的去中心化构建。

3/5/2025 5:48:00 PM

ScienceAI

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

GRPO（Group Relative Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法》。简单来说，GRPO 算法丢弃了 critic model，放弃了价值函数近似，转而通过组内样本的相对比较来计算策略梯度，从而有效降低了训练的不稳定性，同时提高了学习效率。

3/2/2025 2:16:00 PM

机器之心

Karpathy更新AI科普视频，网友：原本周末打算结个婚，改看视频了

他是真的想教会大家。刚刚，赛博活佛 Andrej Karpathy 更新了一个长达 2 个多小时的学习视频，主题是 ——「我是如何使用大型语言模型（LLM）的」。这个视频是 Karpathy 面向普通观众的系列视频之一。

2/28/2025 1:20:00 PM

机器之心

DeepSeek FlashMLA：大模型推理的“涡轮增压器”

FlashMLA（Flash Multi-head Latent Attention）是DeepSeek针对英伟达Hopper架构GPU（如H800/H100）设计的高效解码内核，其核心技术围绕多头潜在注意力（MLA）机制展开，通过软硬件协同优化实现性能突破

2/25/2025 9:08:12 AM

AI在线

清华团队新算法玩转频域时域，压缩95%计算量实现语音分离新SOTA！

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/14/2025 1:08:00 PM

机器之心

字节最新OmniHuman数字人模型即将上线即梦

近期，即梦AI在官方社交媒体上发布了一条新功能上线预告片。视频显示，采用了全新的多模态视频生成模型OmniHuman，用户仅需输入一张图片和一段音频，就可以生成一条生动的AI视频，有望大幅提升AI短片的制作效率和质量。图片来自即梦AI视频号内容截图OmniHuman技术主页信息显示，该模型为字节跳动自研的闭源模型，可支持肖像、半身以及全身等不同尺寸的图片输入，并根据输入的音频，在视频中让人物生成与之匹配的动作，包括演讲、唱歌、乐器演奏以及移动。

2/7/2025 5:36:00 PM

新闻助手

突发｜刚加入Anthropic的OpenAI联创John Schulman，又离职了！

距离他加入 Anthropic，仅仅过去了半年时间。本周四消息，去年刚刚加入知名 AI 创业公司 Anthropic 的 OpenAI 联合创始人约翰・舒尔曼 (John Schulman) 已辞去这家人工智能初创公司的职务。「我们很遗憾看到 John 离开，但我们完全支持他寻求新机会的决定，并祝他一切顺利，」Anthropic 首席科学官 Jared Kaplan 在发给媒体的电子邮件中表示。

2/6/2025 2:50:00 PM

机器之心

Go语言开发AI智能体有多丝滑？字节重磅开源Eino框架，内含保姆级教程

2/4/2025 8:30:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

基础

千寻位置免费开放时空智能三体套件，加速具身机器人全域全场景

从0到1玩转MCP：AI的「万能插头」，代码手把手教你！

硅基战队来袭，联想中国誓师大会宣布智能体矩阵已成

维他动力种子轮融资2亿元，今年底发布首款消费级机器人产品

不是CG？没加速？这个国产机器人跳「斧头帮」舞火了，网友：流畅到不像真的

加速精准医疗，开源GNN实现分子精准建模，质谱识别准确率提升至49%

华为昇腾适配阶跃星辰Step-Video和Step-Audio开源大模型，上线魔乐社区

OmniParser V2 在 Windows 系统上的详细安装与运行指南

Nature子刊 | 光镜电镜通用，Meta「分割一切」模型用到显微镜图像上了

11天实现18种广谱抗菌素设计，体外验证成功率94.4%，浙大侯廷军等用LLM方法从头设计AMP

多中心医学图像分析模型，VFMGL框架破解数据孤岛难题，93.4% Dice系数的卓越表现

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

Karpathy更新AI科普视频，网友：原本周末打算结个婚，改看视频了

DeepSeek FlashMLA：大模型推理的“涡轮增压器”

清华团队新算法玩转频域时域，压缩95%计算量实现语音分离新SOTA！

字节最新OmniHuman数字人模型即将上线即梦

突发｜刚加入Anthropic的OpenAI联创John Schulman，又离职了！

Go语言开发AI智能体有多丝滑？字节重磅开源Eino框架，内含保姆级教程