应用

通义灵码上线Qwen2.5-Max推理模型

2025年3月3日，通义灵码宣布上线其最新推理模型Qwen2.5-Max，为开发者带来强大的编程和数学能力支持。 Qwen2.5-Max使用了超过20万亿token的预训练数据，并结合精心设计的后训练方案，展现出卓越的性能。在多项基准测试中，Qwen2.5-Max表现突出。

3/3/2025 9:42:00 PM

AI在线

DeepSeek推出后，移动端AI风向要变

或许下一波 AI 创新，不是比谁的模型更大，而是比谁的模型离你更近。 DeepSeek R1 正在对整个科技领域产生巨大影响，颠覆人们有关 AI 的认知。在移动端，革新正在快速发生。

3/3/2025 9:07:00 PM

机器之心

多元推理刷新「人类的最后考试」记录，o3-mini(high)准确率最高飙升到37％

近段时间，DeepSeek R1 推理模型引爆了国内外社交媒体，让人们见识到了大语言模型类人的深度思考能力。虽然 DeepSeek R1、OpenAI o1 和 o3 等推理模型在数学和编程领域取得了重大进展，但在面对一些测试基准时仍然力不从心，比如国际数学奥林匹克竞赛（IMO）组合问题、抽象和推理语料库（ARC）谜题和人类的最后考试（HLE）问题。以 HLE 为例，主流的推理模型集体翻车，结果显示 DeepSeekR1、o1 的准确率都低于 10%。

3/3/2025 9:04:00 PM

机器之心

万字梳理：揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025

在 DeepSeek 能够破圈而出的一众原因中，完全摒弃传统的监督微调（SFT）、转而采用大规模强化学习（RL）的创新之处是关键所在，这使得模型推理能力在质上取得显著突破，更证明了强化学习在提升大语言模型推理能力方面的巨大潜力。近几年，学界和业界关于 RL 和 LLM 也涌现出了颇多具备开创性意义的研究成果。在 AI 智能体推理与决策研讨会（AIR 2025）上，来自伦敦大学学院、加州大学伯克利分校、普林斯顿大学、华盛顿大学、卡内基梅隆大学、Meta、华为等多位学术界和工业界的研究人员围绕强化学习、推理决策、AI 智能体展开讨论，回答了诸多问题，例如：AI 系统如何模拟类人推理和决策过程？

3/3/2025 8:26:00 PM

王悦

国家网络安全通报中心通报：大模型工具Ollama存在安全风险

今日，国家网络安全通报中心发布关于大模型工具 Ollama 存在安全风险的情况通报，据清华大学网络空间测绘联合研究中心分析，开源跨平台大模型工具 Ollama 默认配置存在未授权访问与模型窃取等安全隐患。鉴于目前 DeepSeek 等大模型的研究部署和应用非常广泛，多数用户使用 Ollama 私有化部署且未修改默认配置，存在数据泄露、算力盗取、服务中断等安全风险，极易引发网络和数据安全事件。

3/3/2025 6:36:49 PM

远洋

中信特钢成功接入 DeepSeek-R1 大模型，推进数字化转型

中信特钢在数字化转型领域迈出了重要一步，近日在互动平台上宣布已成功接入 DeepSeek-R1大模型。公司表示，未来将致力于推动数字技术与实体经济的深度融合，以此为基础进行全方位的改革，力求加快构建数据资产并挖掘数据的潜在价值。中信特钢在推进智能运维方面的努力，是企业在激烈市场竞争中的一项战略举措。

3/3/2025 5:57:00 PM

AI在线

索尼推广AI生成的低质游戏引发玩家强烈不满

近日，索尼在社交媒体上推广一款名为《超市购物模拟器》的游戏，立即引发了 PlayStation 玩家的强烈反响。该游戏是由 AI 生成的低质量作品，在 PlayStation 商店中的评分仅为1.53星，但销量却超过600份。这一现象引起了玩家对索尼内容管理的质疑。

3/3/2025 5:55:00 PM

AI在线

深圳发布具身智能机器人技术创新行动计划，聚焦多模态大模型构建

近日，深圳市科技创新局印发了《深圳市具身智能机器人技术创新与产业发展行动计划（2025-2027年）》，该计划旨在推动具身智能技术的全面发展。文件中明确提出，要构建具身智能基座以及垂直领域的大模型，标志着深圳在智能机器人领域迈出了重要一步。此次行动计划的核心在于基于世界模型以及视觉 - 触觉 - 语言 - 动作（VTLA）等多模态输入输出，开发出具备交互、预测和决策能力的具身智能大模型。

3/3/2025 4:52:00 PM

AI在线

中国首个AI原生IDE：字节跳动发布AI编程工具Trae国内版

3月3日，字节跳动发布AI编程工具Trae国内版，模型搭载doubao-1.5-pro，支持切换满血版DeepSeek R1&V3。这是国内首个AI原生集成开发环境工具（AI IDE），能充分释放AI的潜力，帮助各阶段开发者与AI流畅协作，更快、更高质量地完成编程工作，提升开发效率。用户可通过Trae中国官网（trae.com.cn）下载体验。

3/3/2025 4:38:00 PM

新闻助手

PVUW视频分割Workshop@CVPR 2025 | 征稿！比赛！

第四届真实世界下的像素级视频理解挑战赛（The 4th PVUW challenge）主页/Call for Paper：：复杂场景视频目标分割挑战赛（MOSE Challenge）：参赛、数据集下载：：基于动作描述的指向性视频分割挑战赛（MeViS Challenge）：参赛、数据集下载：真实世界下的像素级视频理解（Pixel-level Video Understanding in the Wild, PVUW）挑战赛将于 CVPR 2025 期间在美国田纳西州纳什维尔的 Music City Center 举办。像素级场景理解是计算机视觉中的核心问题之一，旨在识别图像中每个像素的类别、掩码和语义。然而，现实世界是动态的，基于视频的，而非静态的图像状态，因此学习进行视频分割对于实际应用来说更为合理和实用。

3/3/2025 4:37:00 PM

新闻助手

阿里通义实验室开源视觉文档RAG系统ViDoRAG，准确率达79.4%

近日，阿里巴巴通义实验室宣布开源其最新研发成果——ViDoRAG，这是一款专为视觉文档理解设计的检索增强生成（RAG）系统。 ViDoRAG在GPT-4o模型上的测试显示，其准确率达到了令人瞩目的79.4%，相较传统RAG系统提升了10%以上。这一突破标志着视觉文档处理领域迈出了重要一步，为人工智能在复杂文档理解上的应用提供了新的可能性。

3/3/2025 4:29:00 PM

AI在线

南大周志华团队获奖，AAAI 2025杰出论文奖出炉

自 2 月 25 日起，AAAI 2025 开始在美国宾夕法尼亚州费城举办，会议为期 8 天，将于 3 月 4 日结束。 AAAI 由国际人工智能促进协会主办，是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一，也是中国计算机学会（CCF）推荐的 A 类国际学术会议，每年举办一届。 AAAI 2025 共有 12957 篇有效投稿，录用 3032 篇，录取率为 23.4%。

3/3/2025 4:20:00 PM

机器之心

灵初智能发布端到端VLA模型Psi R0.5，仅需两小时数据实现物品、场景全面泛化

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

3/3/2025 4:16:00 PM

机器之心

Cykel AI推出AI招聘助手Lucy，每天仅需1.63美元，效率提升5-10倍

Cykel AI PLC（伦敦证券交易所代码:CYK）近日宣布，其人工智能数字助手 Lucy 正式上线，旨在彻底变革招聘行业。随着人力资源和招聘市场对效率的日益追求，Lucy 的推出正是应运而生。 Cykel AI 首席执行官兼创始人 Ewan Collinge 表示，Lucy 将帮助招聘企业在竞争激烈的人才市场中获得重要的竞争优势。

3/3/2025 3:49:00 PM

AI在线

深圳：重点支持具身智能机器人核心零部件、AI 芯片、仿生灵巧手等关键核心技术攻关

《深圳市具身智能机器人技术创新与产业发展行动计划（2025-2027 年）》印发。其中提到，到 2027 年，在机器人关键核心零部件、AI 芯片、人工智能与机器人融合技术、多模态感知技术、高精度运动控制技术、灵巧操作技术等方面取得突破。新增培育估值过百亿企业 10 家以上、营收超十亿企业 20 家以上，实现十亿级应用场景落地 50 个以上，关联产业规模达到 1000 亿元以上，具身智能机器人产业集群相关企业超过 1200 家。打造公共服务平台矩阵，吸引更多上下游企业、科研机构、创新团队等加入，形成更完善的产业生态，具身智能机器人产业综合实力达到国际领先水平。

3/3/2025 3:32:39 PM

远洋