AI在线 AI在线

应用

通义灵码上线Qwen2.5-Max推理模型

2025年3月3日,通义灵码宣布上线其最新推理模型Qwen2.5-Max,为开发者带来强大的编程和数学能力支持。 Qwen2.5-Max使用了超过20万亿token的预训练数据,并结合精心设计的后训练方案,展现出卓越的性能。 在多项基准测试中,Qwen2.5-Max表现突出。
3/3/2025 9:42:00 PM
AI在线

DeepSeek推出后,移动端AI风向要变

或许下一波 AI 创新,不是比谁的模型更大,而是比谁的模型离你更近。 DeepSeek R1 正在对整个科技领域产生巨大影响,颠覆人们有关 AI 的认知。 在移动端,革新正在快速发生。
3/3/2025 9:07:00 PM
机器之心

多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%

近段时间,DeepSeek R1 推理模型引爆了国内外社交媒体,让人们见识到了大语言模型类人的深度思考能力。 虽然 DeepSeek R1、OpenAI o1 和 o3 等推理模型在数学和编程领域取得了重大进展,但在面对一些测试基准时仍然力不从心,比如国际数学奥林匹克竞赛(IMO)组合问题、抽象和推理语料库(ARC)谜题和人类的最后考试(HLE)问题。 以 HLE 为例,主流的推理模型集体翻车,结果显示 DeepSeekR1、o1 的准确率都低于 10%。
3/3/2025 9:04:00 PM
机器之心

万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025

在 DeepSeek 能够破圈而出的一众原因中,完全摒弃传统的监督微调(SFT)、转而采用大规模强化学习(RL)的创新之处是关键所在,这使得模型推理能力在质上取得显著突破,更证明了强化学习在提升大语言模型推理能力方面的巨大潜力。 近几年,学界和业界关于 RL 和 LLM 也涌现出了颇多具备开创性意义的研究成果。 在 AI 智能体推理与决策研讨会(AIR 2025)上,来自伦敦大学学院、加州大学伯克利分校、普林斯顿大学、华盛顿大学、卡内基梅隆大学、Meta、华为等多位学术界和工业界的研究人员围绕强化学习、推理决策、AI 智能体展开讨论,回答了诸多问题,例如:AI 系统如何模拟类人推理和决策过程?
3/3/2025 8:26:00 PM
王悦

国家网络安全通报中心通报:大模型工具Ollama存在安全风险

今日,国家网络安全通报中心发布关于大模型工具 Ollama 存在安全风险的情况通报,据清华大学网络空间测绘联合研究中心分析,开源跨平台大模型工具 Ollama 默认配置存在未授权访问与模型窃取等安全隐患。鉴于目前 DeepSeek 等大模型的研究部署和应用非常广泛,多数用户使用 Ollama 私有化部署且未修改默认配置,存在数据泄露、算力盗取、服务中断等安全风险,极易引发网络和数据安全事件。
3/3/2025 6:36:49 PM
远洋

中信特钢成功接入 DeepSeek-R1 大模型,推进数字化转型

中信特钢在数字化转型领域迈出了重要一步,近日在互动平台上宣布已成功接入 DeepSeek-R1大模型。 公司表示,未来将致力于推动数字技术与实体经济的深度融合,以此为基础进行全方位的改革,力求加快构建数据资产并挖掘数据的潜在价值。 中信特钢在推进智能运维方面的努力,是企业在激烈市场竞争中的一项战略举措。
3/3/2025 5:57:00 PM
AI在线

索尼推广AI生成的低质游戏引发玩家强烈不满

近日,索尼在社交媒体上推广一款名为《超市购物模拟器》的游戏,立即引发了 PlayStation 玩家的强烈反响。 该游戏是由 AI 生成的低质量作品,在 PlayStation 商店中的评分仅为1.53星,但销量却超过600份。 这一现象引起了玩家对索尼内容管理的质疑。
3/3/2025 5:55:00 PM
AI在线

深圳发布具身智能机器人技术创新行动计划,聚焦多模态大模型构建

近日,深圳市科技创新局印发了《深圳市具身智能机器人技术创新与产业发展行动计划(2025-2027年)》,该计划旨在推动具身智能技术的全面发展。 文件中明确提出,要构建具身智能基座以及垂直领域的大模型,标志着深圳在智能机器人领域迈出了重要一步。 此次行动计划的核心在于基于世界模型以及视觉 - 触觉 - 语言 - 动作(VTLA)等多模态输入输出,开发出具备交互、预测和决策能力的具身智能大模型。
3/3/2025 4:52:00 PM
AI在线

中国首个AI原生IDE:字节跳动发布AI编程工具Trae国内版

3月3日,字节跳动发布AI编程工具Trae国内版,模型搭载doubao-1.5-pro,支持切换满血版DeepSeek R1&V3。 这是国内首个AI原生集成开发环境工具(AI IDE),能充分释放AI的潜力,帮助各阶段开发者与AI流畅协作,更快、更高质量地完成编程工作,提升开发效率。 用户可通过Trae中国官网(trae.com.cn)下载体验。
3/3/2025 4:38:00 PM
新闻助手

PVUW视频分割Workshop@CVPR 2025 | 征稿!比赛!

第四届真实世界下的像素级视频理解挑战赛(The 4th PVUW challenge)主页/Call for Paper::复杂场景视频目标分割挑战赛(MOSE Challenge):参赛、数据集下载::基于动作描述的指向性视频分割挑战赛(MeViS Challenge):参赛、数据集下载: 真实世界下的像素级视频理解(Pixel-level Video Understanding in the Wild, PVUW)挑战赛将于 CVPR 2025 期间在美国田纳西州纳什维尔的 Music City Center 举办。 像素级场景理解是计算机视觉中的核心问题之一,旨在识别图像中每个像素的类别、掩码和语义。 然而,现实世界是动态的,基于视频的,而非静态的图像状态,因此学习进行视频分割对于实际应用来说更为合理和实用。
3/3/2025 4:37:00 PM
新闻助手

阿里通义实验室开源视觉文档RAG系统ViDoRAG,准确率达79.4%

近日,阿里巴巴通义实验室宣布开源其最新研发成果——ViDoRAG,这是一款专为视觉文档理解设计的检索增强生成(RAG)系统。 ViDoRAG在GPT-4o模型上的测试显示,其准确率达到了令人瞩目的79.4%,相较传统RAG系统提升了10%以上。 这一突破标志着视觉文档处理领域迈出了重要一步,为人工智能在复杂文档理解上的应用提供了新的可能性。
3/3/2025 4:29:00 PM
AI在线

南大周志华团队获奖,AAAI 2025杰出论文奖出炉

自 2 月 25 日起,AAAI 2025 开始在美国宾夕法尼亚州费城举办,会议为期 8 天,将于 3 月 4 日结束。 AAAI 由国际人工智能促进协会主办,是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的 A 类国际学术会议,每年举办一届。 AAAI 2025 共有 12957 篇有效投稿,录用 3032 篇,录取率为 23.4%。
3/3/2025 4:20:00 PM
机器之心

灵初智能发布端到端VLA模型Psi R0.5,仅需两小时数据实现物品、场景全面泛化

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
3/3/2025 4:16:00 PM
机器之心

Cykel AI推出AI招聘助手Lucy,每天仅需1.63美元,效率提升5-10倍

Cykel AI PLC(伦敦证券交易所代码:CYK)近日宣布,其人工智能数字助手 Lucy 正式上线,旨在彻底变革招聘行业。 随着人力资源和招聘市场对效率的日益追求,Lucy 的推出正是应运而生。 Cykel AI 首席执行官兼创始人 Ewan Collinge 表示,Lucy 将帮助招聘企业在竞争激烈的人才市场中获得重要的竞争优势。
3/3/2025 3:49:00 PM
AI在线

深圳:重点支持具身智能机器人核心零部件、AI 芯片、仿生灵巧手等关键核心技术攻关

《深圳市具身智能机器人技术创新与产业发展行动计划(2025-2027 年)》印发。其中提到,到 2027 年,在机器人关键核心零部件、AI 芯片、人工智能与机器人融合技术、多模态感知技术、高精度运动控制技术、灵巧操作技术等方面取得突破。新增培育估值过百亿企业 10 家以上、营收超十亿企业 20 家以上,实现十亿级应用场景落地 50 个以上,关联产业规模达到 1000 亿元以上,具身智能机器人产业集群相关企业超过 1200 家。打造公共服务平台矩阵,吸引更多上下游企业、科研机构、创新团队等加入,形成更完善的产业生态,具身智能机器人产业综合实力达到国际领先水平。
3/3/2025 3:32:39 PM
远洋

印尼 DeepFake 深度伪造 AI 视频骗局泛滥,消息称有民众因“总统的脸”中招

随着AI技术普及,DeepFake视频诈骗在全球范围内泛滥。印尼总统普拉博沃的头像被犯罪分子盗用,制作虚假视频骗取民众钱财。自去年10月以来,已有至少22个虚假账号冒充普拉博沃,通过社交平台骗取“行政费”。#AI诈骗# #DeepFake##印尼深伪视频骗局泛滥#
3/3/2025 3:06:41 PM
漾仔

科大讯飞宣布完成星火深度推理大模型X1全面升级

科大讯飞宣布其深度推理模型 —— 星火 X1进行全新升级。 本次升级旨在提升其在数学、医疗、教育等多个领域的应用能力,带来了一系列亮点和创新。 星火 X1的数学能力得到了显著提升,尤其是在处理竞赛级难题方面的表现。
3/3/2025 3:03:00 PM
AI在线

中国信通院正式启动大模型应用场景图谱编制工作,征集各行各业 AI 成果

中国信通院宣布启动大模型应用场景图谱编制工作,征集AI大模型在各行业的应用成果,旨在推动技术创新,构建多模态、多场景应用图谱,助力我国大模型产业生态建设。#AI大模型##中国信通院#
3/3/2025 2:55:29 PM
漾仔