开源

DeepSeek引发开源生态新思考，欧洲AI巨头Mistral力挺开源

在AI技术快速发展的当下，开源与闭源的争论一直是行业焦点。近期，DeepSeek的崛起引发了新的讨论，而被称为“欧洲OpenAI”的Mistral公司CEO亚瑟·曼什（Arthur Mensch）则明确表示，DeepSeek的开源模型为整个行业带来了重要机遇。 Mistral自2023年在法国巴黎成立以来，一直致力于推动开源生态的发展。

2/18/2025 10:34:36 AM

小菲

微软开源创新框架：可将DeepSeek，变成AI Agent

微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0，可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型，变成可在计算机使用的AI Agent。与V1版本相比，V2在检测较小的可交互UI元素时准确率更高、推理速度更快，延迟降低了60%。在高分辨率Agent基准测试ScreenSpot Pro中，V2 GPT-4o的准确率达到了惊人的39.6%，而GPT-4o原始准确率只有0.8%，整体提升非常大。

2/17/2025 10:36:00 AM

AIGC开放社区

百度宣布下一代文心大模型开源，此前宣布文心一言4月起免费

百度官方今天宣布，其下一代文心大模型4.5系列将于未来几个月内推出，并计划于2025年6月30日正式开源。这一消息标志着百度在人工智能领域的又一重大举措。文心一言4月1日起全面免费百度在2月13日宣布，文心一言将于2025年4月1日0时起全面免费，所有PC端和APP端用户均可免费体验文心系列的最新模型。

2/17/2025 9:10:00 AM

“RAG界的DeepSeek”开源-企业复杂私域知识理解与推理框架PIKE-RAG

PIKE-RAG框架的设计目标是提供一个灵活且可扩展的RAG系统，应对工业应用中复杂多样的任务需求。框架的核心是通过有效的知识提取、理解和组织，以及构建连贯的推理逻辑，解决了RAG系统在工业应用中的局限性。下面来看下PIKE-RAG框架及其实现过程，供参考。

2/17/2025 3:00:00 AM

余俊晖

Seed Research | 视频生成模型最新成果，可仅靠视觉认知世界！现已开源

视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。不同于 Sora 、DALL-E 、Midjourney 等主流多模态模型，VideoWorld 在业界首次实现无需依赖语言模型，即可认知世界。正如李飞飞教授 9 年前 TED 演讲中提到 “幼儿可以不依靠语言理解真实世界”，VideoWorld 仅通过 “视觉信息”，即浏览视频数据，就能让机器掌握推理、规划和决策等复杂能力。

2/14/2025 9:30:00 AM

豆包大模型团队

AMD开源科研AI Agent，一站式自动写论文

科学研究的漫长历程中，受限于时间和资源，许多高质量的研究想法未能得到充分探索。如果能够减少探索想法的限制，研究人员将能够同时研究多个概念，增加科学发现的效率。所以，为了帮助科研人员节省时间快速撰写论文，AMD和约翰·霍普金斯大学的研究人员联合开源了一个专用于科研的AI Agent——Agent Laboratory。

2/12/2025 1:44:12 PM

AIGC开放社区

淘宝卖DeepSeek安装包一月赚数十万？？？我们免费教你本地部署DeepSeek-R1

当看到这条消息时，机器之心编辑部陷入了集体沉默。作为一个免费开源的模型，DeepSeek 竟能让倒卖商如此大赚特赚，也着实让人震惊。而这也从侧面佐证了 DeepSeek 模型引发的本地部署热潮是多么汹涌。

2/12/2025 1:23:47 PM

机器之心

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

近日，全球最大人工智能开源社区 Huggingface 发布了最新的开源大模型排行榜（Open LLM Leaderboard），结果显示，排名前十的开源大模型全都是基于阿里通义千问(Qwen)开源模型进行二次训练的衍生模型。这一成就标志着 Qwen 在开源 AI 领域的主导地位，进一步推动了其在全球的影响力。 Open LLM Leaderboard 被广泛认为是当前最权威的开源大模型榜单，测试维度涵盖了多个领域，包括阅读理解、逻辑推理、数学计算及事实问答等。

2/11/2025 11:55:00 AM

AI在线

“DeepSeek出了一个昏招！”

前两天和几个朋友聚会，有个朋友说：“DeepSeek这么厉害，为什么要开源？美国人都知道了，那着高端显卡一练，一下子就把你超了，开源就是昏招，你看人家OpenAI就不开源。 ”我虽然当了很久的码农，也知道开源的巨大好处，但是他突然这么一说，我一时还不好反驳。

2/11/2025 9:17:57 AM

liuxin

Yandex 开发并开源 Perforator，这款开源工具每年可为企业节省数十亿美元的服务器基础设施成本

全球领先的科技公司 Yandex 开发并开源了 Perforator，这是一款用于对服务器和应用程序进行持续实时监控和分析的创新工具。 Perforator 帮助开发人员识别最占资源的代码部分，并提供详细的统计数据，以便进行后续优化。通过识别代码中的低效部分并支持基于配置文件的优化，Perforator 提供了准确的数据，使企业能够手动优化其应用程序，根据公司规模，降低基础设施成本最多可达 20%。

2/10/2025 2:30:00 PM

新闻助手

李飞飞、DeepSeek为何偏爱这个国产模型？

斯坦福李飞飞团队的一篇论文，近来在AI圈子掀起了一场飓风。他们仅用1000个样本，在16块H100上监督微调26分钟，训出的新模型s1-32B，竟取得了和OpenAI o1、DeepSeek R1等尖端推理模型相当的数学和编码能力！团队也再次证明了测试时Scaling的威力。

2/8/2025 9:30:00 AM

新智元

DeepSeek开源Janus-Pro-7B：多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

中国人工智能公司 DeepSeek 的 R1“推理”人工智能已经引起了广泛关注，位居应用商店排行榜首位并改变了股市。随后DeepSeek又宣布开源新一代多模态模型Janus-Pro-7B，该模型在图像生成、视觉问答等任务中全面超越 OpenAI 的 DALL-E 3 和 Stable Diffusion 3，并以“理解-生成双路径”架构和极简部署方案引发AI社区轰动。性能表现：小模型吊打行业巨头Janus-Pro-7B虽仅有70亿参数（约为GPT-4的1/25），却在关键测试中碾压对手：文生图质量：在GenEval测试中以80%准确率击败DALL-E 3（67%）和Stable Diffusion 3（74%）复杂指令理解：在DPG-Bench测试中达84.19%准确率，能精准生成如“山脚下有蓝色湖泊的雪山”等复杂场景多模态问答：视觉问答准确率超越GPT-4V，MMBench测试得分79.2分接近专业分析模型技术突破：像“双面神”分工协作传统模型让同一套视觉编码器既理解图片又生成图片，如同让厨师同时设计菜单和炒菜。

2/7/2025 11:00:00 AM

AIGC Studio

Meta 首席科学家杨立昆痛批硅谷“常见病”：一种错误的优越感

“科技的进步往往是通过更多有才华的人参与，并且相互分享他们的创新成果，才能加速的。”

2/1/2025 11:33:14 PM

清源

微软等开源AIOpsLab，可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了，一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务，实现故障的自动化检测、定位和解决问题。还具备高度的可观测性，能够收集和分析关键的遥测数据，确保对系统状态和应用环境的深入洞察。

1/27/2025 9:51:24 AM

AIGC开放社区

中国联通发布元景思维链大模型：性能超越GPT-4o 比肩OpenAI o1

今日，中国联通宣布，其旗下联通数据智能有限公司正式发布了元景思维链大模型。这一创新成果已在GitHub、魔搭、始智等多个社区全面开源，标志着中国联通在人工智能领域迈出了重要一步。元景思维链大模型作为中国联通推出的业界首款央企开源通用思维链大模型，展现了强大的慢思考能力和多学科、多场景的通用推理能力。

1/24/2025 1:59:00 PM

AI在线

解决文生图质量和美学问题，字节跳动提出VMix：多维度美学控制方法，一键提升图像美学

本文经AIGC Studio公众号授权转载，转载请联系出处。为了解决扩散模型在文生图的质量和美学问题，字节跳动&中科大研究团队提出VMix美学条件注入方法，通过将抽象的图像美感拆分成不同维度的美学向量引入扩散模型，从而实现细粒度美学图像生成。论文基于提出的方法训练了一个即插即用的模块，无需再训练即可应用于不同的开源模型，提升模型的生成美感。

1/22/2025 9:48:07 AM

AIGC Studio

「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了

昨晚，大模型领域再次「热闹起来」，月之暗面发布在数学、代码、多模态推理能力层面全面对标 OpenAI 的满血版 o1 的多模态思考模型 K1.5。而最近大热的 DeepSeek 正式推出了 DeepSeek-R1，同样在数学、代码和自然语言推理等任务上比肩 OpenAI o1 正式版。去年 12 月开源的大模型 DeepSeek-V3 刚刚掀起了一阵热潮，实现了诸多的不可能。

1/21/2025 11:53:53 AM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练

开源

DeepSeek引发开源生态新思考，欧洲AI巨头Mistral力挺开源

微软开源创新框架：可将DeepSeek，变成AI Agent

百度宣布下一代文心大模型开源，此前宣布文心一言4月起免费

“RAG界的DeepSeek”开源-企业复杂私域知识理解与推理框架PIKE-RAG

Seed Research | 视频生成模型最新成果，可仅靠视觉认知世界！现已开源

推荐一个企业级知识图谱增强的检索增强生成(RAG)的项目

AMD开源科研AI Agent，一站式自动写论文

淘宝卖DeepSeek安装包一月赚数十万？？？我们免费教你本地部署DeepSeek-R1

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

“DeepSeek出了一个昏招！”

Yandex 开发并开源 Perforator，这款开源工具每年可为企业节省数十亿美元的服务器基础设施成本

李飞飞、DeepSeek为何偏爱这个国产模型？

DeepSeek开源Janus-Pro-7B：多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

Meta 首席科学家杨立昆痛批硅谷“常见病”：一种错误的优越感

微软等开源AIOpsLab，可构建自主云AI Agent

中国联通发布元景思维链大模型：性能超越GPT-4o 比肩OpenAI o1

解决文生图质量和美学问题，字节跳动提出VMix：多维度美学控制方法，一键提升图像美学

「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了