AI在线 AI在线

模型

Anthropic预测26年AI智力堪比诺奖得主!美国AI行动计划发布在即,五角大楼紧急布局

截止到2026-2027年,AI智力水平将达到诺奖级得主。 Anthropic最新长文,再次宣告,人类离超级智能体近在咫尺。 报告地址:,CEO Dario Amodei在「Machines of Loving Grace」一文中,曾大胆预测——2026年底-2027年初,人类将见证强大AI系统诞生。
3/10/2025 7:30:00 AM
新智元

7B的DeepSeek蒸馏Qwen数学超o1!在测试时间强化学习,MIT积分题大赛考93分

见识过32B的QwQ追平671的DeepSeek R1后——刚刚,7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事? 图片新方法LADDER,通过递归问题分解实现AI模型的自我改进,同时不需要人工标注数据。 使Deepseek-R1蒸馏的Qwen2.5 7B模型在麻省理工学院积分大赛(MIT Integration Bee)上达到90分超越o1。
3/10/2025 1:00:00 AM

7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!

研究团队构成:香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。 团队核心成员:香港科技大学的研究助理教授曹嘉伦,主要研究领域包括 AI&SE、人工智能测试、形式化验证等;中国科学院软件研究所副研究员陆垚杰,主要研究领域包括大语言模型及其应用。 随着 DeepSeek-R1 的流行与 AI4Math 研究的深入,大模型在辅助形式化证明写作方面的需求日益增长。
3/8/2025 3:46:00 PM
机器之心

自己训练模型才能掌握未来?一股脑押注应用层或许值得警惕

「所有投资者都在押注应用层…… 对训练能力存在强烈的负面偏见…… 我担心这是一场冒险赌注和市场误判。 」这是一篇标题为「The Model is the Product(模型即产品)」的文章的主要观点。 文章指出,当前很多企业都以集成商的形式在提供 AI 服务,也就是调用 OpenAI、Anthropic 等大公司模型的 API。
3/8/2025 3:31:00 PM
机器之心

Nature子刊 | 光镜电镜通用,Meta「分割一切」模型用到显微镜图像上了

编辑丨coisini识别显微镜图像中的对象,例如光学显微镜(LM)下的细胞和细胞核是生物学图像分析中的关键任务之一。 由于显微镜成像方式的多样性和不同维度(二维 / 三维,时间维度)的存在,这些识别任务具有挑战性,目前需要采用不同的方法来解决。 基于深度学习的方法在过去几年中显著改善了 LM 下的细胞和细胞核分割,电子显微镜(EM)下的细胞、神经元和细胞器分割。
3/7/2025 1:14:00 PM
ScienceAI

DeepSeek的MLA架构:大模型迁移的新突破

在人工智能领域,DeepSeek-R1的推出引发了广泛关注,这一创新代表了 AI 产业的颠覆性进展。 其多头潜在注意力网络(Multi-head Latent Attention,MLA)架构,借助低秩压缩技术显著降低了训练与推理的成本,甚至仅为同等性能大模型的十分之一。 这一成果由复旦大学 NLP 实验室的博士后纪焘及其团队共同完成,目标是让任意预训练的大语言模型能够快速迁移到 MLA 架构,而无需重新从头开始训练。
3/7/2025 10:52:00 AM
AI在线

沉寂很久的Mistral AI推出号称世界最强OCR

欧洲AI明星公司Mistral AI 今日发布 Mistral OCR,一款号称“世界最佳文档理解 API”的全新产品。 Mistral OCR 是一款光学字符识别(OCR)API,但它远不止于简单的文字识别。 与其他模型不同,Mistral OCR 能够全面理解文档的每一个元素,包括媒体、文本、表格、公式等,并展现出前所未有的准确性和认知能力。
3/7/2025 10:23:03 AM
AI寒武纪

另一个来自中国本土"DeepSeek"时刻?全球首个通用人工智能代理发布

I 圈又炸了锅! 另一个来自中国本土"DeepSeek"时刻今天,Manus AI 悄悄憋了一年的大招终于揭开了神秘面纱——通用AI Agent「Manus」正式发布早期预览版!  这可不是市面上那些只能跟你聊天的“智能聊天机器人”的升级版,而是一个 真正意义上的自主智能体,它最大的亮点在于:打通了从想法到执行的完整链路!
3/7/2025 10:12:16 AM
AI寒武纪

Light-R1-32B:低成本高性能的数学解题新星闪耀登场

2025年3月6日,一款名为 **Light-R1-32B** 的全新语言模型正式亮相。 这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器,经过特别训练,以其卓越的数学解题能力、低廉的训练成本以及可复现性,成为人工智能领域的一大亮点。 开发团队xAI表示,Light-R1-32B不仅在性能上超越同类模型,还为学术研究和实际应用提供了极具价值的参考。
3/7/2025 10:00:29 AM
AI在线

诸葛亮 + 水浒传 - 三国演义 = ?一文搞懂什么是向量嵌入

一起来开个脑洞,如果诸葛亮穿越到《水浒传》的世界,他会成为谁? 武松、宋江、还是吴用? 这看似是一道文学题,但我们可以用数学方法来求解:诸葛亮 水浒传 - 三国演义 = ?
3/7/2025 9:00:00 AM
小喵学AI

智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!

BGE系列模型自发布以来广受社区好评。 近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。 BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。
3/7/2025 8:40:00 AM
新智元

阿里千问QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑

凌晨,阿里重磅开源全球最顶尖AI模型——通义千问QwQ-32B推理模型。 它仅用320亿参数,便与目前公认的开源最强6710亿参数的满血版DeepSeek-R1(370亿被激活)相媲美。 甚至,QwQ-32B在多项基准测试中全面超越o1-mini。
3/7/2025 8:30:00 AM
新智元

从自我进化视角出发,全面解析LLM的推理能力技术演进路径

论文标题:A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接::. 引言在人工智能领域,大型语言模型的复杂推理研究正成为学术界和工业界关注的焦点。 随着 OpenAI 的 O1 以及后续 DeepSeek R1 等突破性成果的发布,这一领域的研究热度持续升温,引发了广泛的学术讨论和实践探索。
3/6/2025 9:08:00 PM
机器之心

Portkey AI Gateway:轻松整合多种大语言模型的开源AI解决方案

随着开源 AI 框架的快速发展,开发者们在部署 AI 模型时获得了前所未有的灵活性。 Portkey AI Gateway 作为一款开源项目,旨在简化 AI 模型的编排,提供统一的 API 接口,助力开发者轻松整合多种 AI 模型。 除了支持大型语言模型(LLMs),Portkey 还涵盖了视觉、音频(文本转语音和语音转文本)、图像生成等多模态生成 AI 模型。
3/6/2025 6:00:00 PM
AI在线

腾讯混元发布图生视频模型HunyuanVideo-I2V,并上线对口型等玩法

腾讯宣布开源其新研发的图像转视频生成框架 ——HunyuanVideo-I2V。 该模型的发布是在其成功开源 HunyuanVideo 之后的又一重要进展,旨在推动开放源代码社区的深入探索。 HunyuanVideo-I2V 结合了先进的视频生成技术,能够将静态图像转换为生动的视频内容,为创作者提供了更多的可能性。
3/6/2025 4:34:00 PM
AI在线

​Cohere发布全新多模态AI模型Aya Vision,提供32B和8B两个版本

人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。 该实验室声称,该模型在行业内处于领先地位。 Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。
3/6/2025 2:54:00 PM
AI在线

多模态检索新突破!智源开源多模态向量模型BGE-VL

2025年3月6日,北京智源人工智能研究院宣布开源多模态向量模型BGE-VL,这一成果标志着多模态检索领域的新突破。 BGE-VL模型在图文检索、组合图像检索等多模态检索任务中取得了最佳效果,显著提升了多模态检索的性能。 BGE-VL的开发基于大规模合成数据集MegaPairs,该数据集通过结合多模态表征模型、多模态大模型和大语言模型,从海量图文语料库中高效挖掘多模态三元组数据。
3/6/2025 2:46:00 PM
AI在线

离谱!OpenAI被曝博士级AI智能体2万美元/月,网友:DeepSeek快把价格打下去

什么样的AI,值得你花20000刀一个月? OpenAI告诉你:用我们的博士级AI智能体吧,它保管值! 今天这个消息,让所有人瞠目结舌:OpenAI的高管们计划发布三类智能体产品,价格分几档,最贵的一档月费高达2万美金。
3/6/2025 11:31:10 AM
新智元