开源

DeepSeek推理引擎开源新路径，助力vLLM生态再升级

最近，DeepSeek 宣布了一项重要决定:将其自研的推理引擎进行开源，但并不会直接向公众开放完整的代码库。相反，他们选择与现有的开源项目 vLLM 合作，致力于分享核心的优化成果。这一举动旨在解决开源社区中普遍存在的代码库分歧、基础设施依赖及维护资源有限等难题。

4/16/2025 2:01:15 PM

AI在线

刚刚，智谱一口气开源6款模型，200 tokens/秒解锁商用速度之最 | 免费

就在刚刚，智谱一口气上线并开源了三大类最新的GLM模型：沉思模型GLM-Z1-Rumination推理模型GLM-Z1-Air基座模型GLM-4-Air-0414若是以模型大小（9B和32B）来划分，更是可以细分为六款。首先是两个9B大小的模型：GLM-4-9B-0414：主攻对话，序列长度介于32K到128K之间GLM-Z1-9B-0414：主攻推理，序列长度介于32K到128K之间还有四个32B大小的模型，它们分别是：GLM-4-32B-Base-0414：基座模型，序列长度介于32K到128K之间GLM-4-32B-0414：主攻对话，序列长度介于32K到128K之间GLM-Z1-32B-0414：主攻推理，序列长度介于32K到128K之间GLM-Z1-32B-Rumination-0414：主攻推理，序列长度为128K而随着一系列模型的开源，智谱也解锁了一项行业之最——推理模型GLM-Z1-32B-0414做到了性能与DeepSeek-R1等顶尖模型相媲美的同时，实测推理速度可达200 tokens/秒。如此速度，已然是目前国内商业模型中速度最快，而且它的高性价比版本价格也仅为DeepSeek-R1的1/30。

4/15/2025 12:16:17 PM

奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

近了，近了！全网多个流出的代码截图显示，满血版o3、o4-mini，以及o4-mini high，有极大概率在下周发布。不仅如此，在OpenRouter平台上，一款神秘模型Optimus Alpha（ELO得分1387）直接霸榜，据称就是o4-mini。

4/14/2025 9:17:00 AM

新智元

OpenAI史上最硬核技术播客！系统揭秘GPT4.5诞生，已进入数据受限时代！小哥亲述大模型修bug血泪史；还有一个重磅开源消息

整理 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）刚刚，奥特曼亲自预热的那期播客，完整版视频终于上线啦！！！

4/11/2025 1:41:19 PM

伊风

Kimi 16B胜GPT-4o！开源视觉推理模型：MoE架构，推理时仅激活2.8B

刚刚，Kimi团队上新了！开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking，多模态和推理双双拿捏。按照Kimi官方的说法，其关键亮点如下：都是基于MoE架构，总参数为16B，但推理时仅激活2.8B；具备强大的多模态推理能力（媲美参数大10倍的模型）和Agent能力；支持128K上下文窗口；采用相对较为宽松的MIT许可证。

4/11/2025 9:10:00 AM

量子位

大模型“自动修 bug”能力将提升，豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

4 月 10 日消息，豆包大模型团队今日通过官方公众号宣布，首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源，可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上，Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言，是真正面向“全栈工程”的评测基准。其数据均来自 GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。

4/10/2025 2:30:12 PM

清源

UC伯克利华人开源14B「o3-mini」，代码版R1突袭OpenAI王座！

OpenAI o1/o3-mini级的推理模型，竟被抢先开源了？刚刚，来自UC伯克利和Together AI的联合团队，重磅推出了一款完全开源的代码推理模型——DeepCoder-14B-Preview。现在，只需要14B就可以拥有一个媲美o3-mini的本地模型，并且完全免费！

4/10/2025 10:02:43 AM

新智元

英伟达253B开源新王登场，Llama 4三天变陪衬！直逼DeepSeek-R1成推理天花板

Llama 4诞生不过3天，反手就被超越了。刚刚，英伟达官宣开源「超大杯」Llama Nemotron推理模型，共有253B参数，基于Llama-3.1-405B微调而来。在多项基准测试中，Llama Nemotron一举击败了两款Llama 4模型。

4/9/2025 10:40:32 AM

新智元

UI-R1 | 仅136张截图，vivo开源DeepSeek R1式强化学习，提升GUI智能体动作预测

基于规则的强化学习（RL/RFT）已成为替代 SFT 的高效方案，仅需少量样本即可提升模型在特定任务中的表现。该方法通过预定义奖励函数规避人工标注成本，如 DeepSeek-R1 在数学求解中的成功应用，以及多模态领域在图像定位等任务上的性能突破（通常使用 IOU 作为规则 reward）。 vivo 与香港中文大学的研究团队受到 DeepSeek-R1 的启发，首次将基于规则的强化学习（RL）应用到了 GUI 智能体领域。

4/9/2025 9:41:43 AM

机器之心

MySQL遇到AI：字节跳动开源 MySQL 虚拟索引 VIDEX

虚拟索引技术（virtual index，也称为 hypothetical index）在数据库系统的查询优化、索引推荐等场景中扮演着关键角色。简单来说，虚拟索引可以理解为数据库的'沙盘推演'系统——无需真实构建索引，仅基于统计信息即可精准模拟不同索引方案对查询计划的优化效果。由于虚拟索引的创建/删除代价极低，使用者可以大量创建和删除索引、反复推演，确定最有效的索引方案。

4/9/2025 9:20:00 AM

字节跳动开源

三个LLM顶一个OpenAI？2亿条性能记录加持，路由n个「小」模型逆袭

当前大模型研究面临三大困境：算力垄断（顶尖成果集中于大厂）、成本壁垒（单次训练成本高，可能需要数千GPU小时）以及技术路径单一化（过度依赖单一模型的规模扩展）。为突破这些限制，路由LLM（Routing LLM）范式应运而生——通过智能调度实现多个开源小模型的协同增效，以「组合创新」替代「规模竞赛」。代码：: ： level的MoE（Mixture-of-Experts），传统MoE通过在模型内部扩展专家网络（如稀疏激活的FFN层）提升性能，而路由LLM将完整LLM视为独立「专家」，通过预训练Router动态分配任务输入。

4/9/2025 9:00:00 AM

新智元

首个个性化对齐大模型问世！可精准识别用户内在动机和偏好，还有百万用户画像开源数据集 | 蚂蚁&人大

如何让大模型更懂「人」？虽然现有大模型经过了人类价值观对齐训练，但其对齐效果往往会让少数群体的声音被系统性淹没。那随之而来的问题是，当大模型服务全球用户，标准化对齐范式是否正在制造新的数字鸿沟？

4/8/2025 9:12:00 AM

量子位

模态编码器 | 超强开源CLIP模型OpenCLIP

来自LAION、UC伯克利、HuggingFace等的工作，这篇工作的研究动机也很简单，CLIP 模型在多模态领域展现出了巨大潜力，但原始 CLIP 模型未完全开源，限制了其更广泛的应用和深入研究。 OpenCLIP 旨在通过开源的方式，让更多开发者能够无门槛地利用这一先进模型，推动多模态技术在各个领域的应用和发展。模型架构和原始CLIP无异，下面简单介绍这篇工作中的一些研究规律和实验结果。

4/8/2025 4:20:00 AM

Goldma

一文读懂开源 Llama 4 模型

Hello folks，我是 Luga，今天我们来聊一下人工智能领域的最新大模型技术进展 - 构建高效、灵活、以及开源的的大模型 - Llama 4 。在人工智能领域，随着技术的不断进步，越来越多的强大语言模型应运而生。 Llama 4 作为 Meta 推出的最新一代大规模语言模型，凭借其卓越的性能和创新的架构设计，成为了当前 AI 领域的焦点之一。

4/7/2025 8:40:00 AM

Luga Lee

RAG实战|向量数据库LanceDB指南

LanceDB介绍LanceDB是一个开源的用 Rust 实现的向量数据库（），它的主要特点是：提供单机服务，可以直接嵌入到应用程序中支持多种向量索引算法，包括Flat、HNSW、IVF等。支持全文检索，包括BM25、TF-IDF等。支持多种向量相似度算法，包括Cosine、L2等。

4/3/2025 4:02:14 PM

周末程序猿

大模型RL不止数学代码！7B奖励模型搞定医学法律经济全学科，不用思维链也能做题

一个7B奖励模型搞定全学科，大模型强化学习不止数学和代码。 o1/r1的强化学习很强，但主要探索了数学和代码领域，因为这两个领域的数据结构化程度高，奖励函数/奖励模型比较好设计。那么，想提升大模型在其他学科领域的能力该怎么办？

4/3/2025 9:23:08 AM

量子位

DAPO：面向开源大语言模型的解耦裁剪与动态采样策略优化系统

在人工智能技术快速迭代发展的背景下，大语言模型（LLMs）已成为自然语言处理与生成领域的核心技术。然而，将这些模型与人类偏好精确对齐并增强其复杂推理能力的挑战，促使研究者开发了一系列复杂的强化学习（RL）技术。 DAPO（解耦裁剪和动态采样策略优化，Decoupled Clip and Dynamic Sampling Policy Optimization）作为一个突破性的开源大语言模型强化学习系统应运而生，为该领域带来了技术变革。

4/3/2025 8:00:00 AM

Jenray

DeepSeek-V3击败R1开源登顶！杭州黑马撼动硅谷AI霸主，抹去1万亿市值神话

DeepSeek依然很能打，春节余波还在扩散！据AI产品分析平台aitools.xyz统计，DeepSeek每月新增网站访问量超过了ChatGPT。作为异军突起的现象级产品，DeepSeek的增长速度除了创造AI产品的增长奇迹，更是重新定义了全球的AI竞赛格局。

4/2/2025 9:21:00 AM

新智元

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练

开源