模型
7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!
研究团队构成:香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。 团队核心成员:香港科技大学的研究助理教授曹嘉伦,主要研究领域包括 AI&SE、人工智能测试、形式化验证等;中国科学院软件研究所副研究员陆垚杰,主要研究领域包括大语言模型及其应用。 随着 DeepSeek-R1 的流行与 AI4Math 研究的深入,大模型在辅助形式化证明写作方面的需求日益增长。
自己训练模型才能掌握未来?一股脑押注应用层或许值得警惕
「所有投资者都在押注应用层…… 对训练能力存在强烈的负面偏见…… 我担心这是一场冒险赌注和市场误判。 」这是一篇标题为「The Model is the Product(模型即产品)」的文章的主要观点。 文章指出,当前很多企业都以集成商的形式在提供 AI 服务,也就是调用 OpenAI、Anthropic 等大公司模型的 API。
Nature子刊 | 光镜电镜通用,Meta「分割一切」模型用到显微镜图像上了
编辑丨coisini识别显微镜图像中的对象,例如光学显微镜(LM)下的细胞和细胞核是生物学图像分析中的关键任务之一。 由于显微镜成像方式的多样性和不同维度(二维 / 三维,时间维度)的存在,这些识别任务具有挑战性,目前需要采用不同的方法来解决。 基于深度学习的方法在过去几年中显著改善了 LM 下的细胞和细胞核分割,电子显微镜(EM)下的细胞、神经元和细胞器分割。
DeepSeek的MLA架构:大模型迁移的新突破
在人工智能领域,DeepSeek-R1的推出引发了广泛关注,这一创新代表了 AI 产业的颠覆性进展。 其多头潜在注意力网络(Multi-head Latent Attention,MLA)架构,借助低秩压缩技术显著降低了训练与推理的成本,甚至仅为同等性能大模型的十分之一。 这一成果由复旦大学 NLP 实验室的博士后纪焘及其团队共同完成,目标是让任意预训练的大语言模型能够快速迁移到 MLA 架构,而无需重新从头开始训练。
沉寂很久的Mistral AI推出号称世界最强OCR
欧洲AI明星公司Mistral AI 今日发布 Mistral OCR,一款号称“世界最佳文档理解 API”的全新产品。 Mistral OCR 是一款光学字符识别(OCR)API,但它远不止于简单的文字识别。 与其他模型不同,Mistral OCR 能够全面理解文档的每一个元素,包括媒体、文本、表格、公式等,并展现出前所未有的准确性和认知能力。
另一个来自中国本土"DeepSeek"时刻?全球首个通用人工智能代理发布
I 圈又炸了锅! 另一个来自中国本土"DeepSeek"时刻今天,Manus AI 悄悄憋了一年的大招终于揭开了神秘面纱——通用AI Agent「Manus」正式发布早期预览版! 这可不是市面上那些只能跟你聊天的“智能聊天机器人”的升级版,而是一个 真正意义上的自主智能体,它最大的亮点在于:打通了从想法到执行的完整链路!
Light-R1-32B:低成本高性能的数学解题新星闪耀登场
2025年3月6日,一款名为 **Light-R1-32B** 的全新语言模型正式亮相。 这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器,经过特别训练,以其卓越的数学解题能力、低廉的训练成本以及可复现性,成为人工智能领域的一大亮点。 开发团队xAI表示,Light-R1-32B不仅在性能上超越同类模型,还为学术研究和实际应用提供了极具价值的参考。
诸葛亮 + 水浒传 - 三国演义 = ?一文搞懂什么是向量嵌入
一起来开个脑洞,如果诸葛亮穿越到《水浒传》的世界,他会成为谁? 武松、宋江、还是吴用? 这看似是一道文学题,但我们可以用数学方法来求解:诸葛亮 水浒传 - 三国演义 = ?
智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!
BGE系列模型自发布以来广受社区好评。 近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。 BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。
阿里千问QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑
凌晨,阿里重磅开源全球最顶尖AI模型——通义千问QwQ-32B推理模型。 它仅用320亿参数,便与目前公认的开源最强6710亿参数的满血版DeepSeek-R1(370亿被激活)相媲美。 甚至,QwQ-32B在多项基准测试中全面超越o1-mini。
从自我进化视角出发,全面解析LLM的推理能力技术演进路径
论文标题:A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接::. 引言在人工智能领域,大型语言模型的复杂推理研究正成为学术界和工业界关注的焦点。 随着 OpenAI 的 O1 以及后续 DeepSeek R1 等突破性成果的发布,这一领域的研究热度持续升温,引发了广泛的学术讨论和实践探索。
Portkey AI Gateway:轻松整合多种大语言模型的开源AI解决方案
随着开源 AI 框架的快速发展,开发者们在部署 AI 模型时获得了前所未有的灵活性。 Portkey AI Gateway 作为一款开源项目,旨在简化 AI 模型的编排,提供统一的 API 接口,助力开发者轻松整合多种 AI 模型。 除了支持大型语言模型(LLMs),Portkey 还涵盖了视觉、音频(文本转语音和语音转文本)、图像生成等多模态生成 AI 模型。
腾讯混元发布图生视频模型HunyuanVideo-I2V,并上线对口型等玩法
腾讯宣布开源其新研发的图像转视频生成框架 ——HunyuanVideo-I2V。 该模型的发布是在其成功开源 HunyuanVideo 之后的又一重要进展,旨在推动开放源代码社区的深入探索。 HunyuanVideo-I2V 结合了先进的视频生成技术,能够将静态图像转换为生动的视频内容,为创作者提供了更多的可能性。
Cohere发布全新多模态AI模型Aya Vision,提供32B和8B两个版本
人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。 该实验室声称,该模型在行业内处于领先地位。 Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。
多模态检索新突破!智源开源多模态向量模型BGE-VL
2025年3月6日,北京智源人工智能研究院宣布开源多模态向量模型BGE-VL,这一成果标志着多模态检索领域的新突破。 BGE-VL模型在图文检索、组合图像检索等多模态检索任务中取得了最佳效果,显著提升了多模态检索的性能。 BGE-VL的开发基于大规模合成数据集MegaPairs,该数据集通过结合多模态表征模型、多模态大模型和大语言模型,从海量图文语料库中高效挖掘多模态三元组数据。
离谱!OpenAI被曝博士级AI智能体2万美元/月,网友:DeepSeek快把价格打下去
什么样的AI,值得你花20000刀一个月? OpenAI告诉你:用我们的博士级AI智能体吧,它保管值! 今天这个消息,让所有人瞠目结舌:OpenAI的高管们计划发布三类智能体产品,价格分几档,最贵的一档月费高达2万美金。
全球首款通用AI助手发布 中国AI产品Manus一夜刷屏
近日,全球首款通用Agent(自主智能体)产品Manus正式开启了部分内测,这标志着AI自主智能领域迈出了关键性的一步。 Manus以其强大的独立思考、规划并执行复杂任务的能力,直接交付完整成果,展现了前所未有的通用性和执行能力。 与现有的AI助手相比,Manus不仅具备多任务操作能力,如Claude的Computer use等,更能在多个领域实现更高的执行质量。
IBM 推出小型AI模型 Granite 3.2 ,强调高效推理与实用性
IBM 最近发布了其最新的 Granite3.2大型语言模型,旨在为企业和开源社区提供 “小巧、高效、实用” 的企业人工智能解决方案。 该模型不仅具备多模态和推理能力,还提升了灵活性和成本效益,使得用户更容易采用。 Granite3.2引入了视觉语言模型(VLM),用于处理文档,进行数据分类和提取。