大模型

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

近日，全球最大人工智能开源社区 Huggingface 发布了最新的开源大模型排行榜（Open LLM Leaderboard），结果显示，排名前十的开源大模型全都是基于阿里通义千问(Qwen)开源模型进行二次训练的衍生模型。这一成就标志着 Qwen 在开源 AI 领域的主导地位，进一步推动了其在全球的影响力。 Open LLM Leaderboard 被广泛认为是当前最权威的开源大模型榜单，测试维度涵盖了多个领域，包括阅读理解、逻辑推理、数学计算及事实问答等。

2/11/2025 11:55:00 AM

AI在线

从 DeepSeek 看25年前端的一个小趋势

从 DeepSeek 看25年前端的一个小趋势大家好，我卡颂。最近DeepSeek R1爆火。有多火呢？

2/11/2025 10:17:19 AM

卡颂

DeepSeek R1 震撼登场：从介绍到使用

春节期间，DeepSeek 掀起了一股热潮，成为了科技领域的热门话题。身边很多非圈内人士茶余饭后也在讨论 DeepSeek，足以见得其火爆程度。介绍DeepSeek 全称：杭州深度求索人工智能基础技术研究有限公司，成立于 2023 年 7 月 17 日。

2/11/2025 8:35:30 AM

oec2003

1分钟学会DeepSeek本地部署，小白也能搞定！

DeepSeek 是国内顶尖 AI 团队「深度求索」开发的多模态大模型，具备数学推理、代码生成等深度能力，堪称"AI界的六边形战士"。 DeepSeek 身上的标签有很多，其中最具代表性的标签有以下两个：低成本（不挑硬件、开源）高性能（推理能力极强、回答准确）一、为什么要部署本地DeepSeek？相信大家在使用 DeepSeek 时都会遇到这样的问题：图片这是由于 DeepSeek 大火之后访问量比较大，再加上漂亮国大规模、持续的恶意攻击，导致 DeepSeek 的服务器很不稳定。

2/10/2025 12:00:10 AM

磊

为什么中国只有一个 DeepSeek？

DeepSeek 风暴后，中国的大模型创业圈会发生什么样的变化？近日来，笔者也与多位业内人士进行了探讨，发现国产大模型圈目前出现了两个极端：一个是极端的热血沸腾，另一个则是极端的霜打茄子。前者以积极拥抱 DeepSeek 生态的算力厂商与模型服务厂商、以及原先没有能力参与大模型“军备竞赛”的开源受益者为代表，后者则以其他中国大模型创业公司（俗称“大模型六小虎”）与过去两年投资了这些公司的 VC 们为主，形成了一个“冰火两重天”的局面。

2/9/2025 5:23:00 PM

陈彩娴

OpenAI公开了大模型o3-mini的推理思维链

2月8日消息，据外媒报道，OpenAI更新了o3-mini AI模型的“思维链”功能，让用户可以看到模型的思考过程。这是在DeepSeek-R1发布之后发生的，DeepSeek-R1是一个竞争对手的推理模型，也显示了其反应背后的思维过程。推理模型旨在逐步分解其决策过程，因此需要更长的时间来生成响应。

2/8/2025 5:00:11 PM

腾讯云上线DeepSeek全系API接口并打通联网搜索

腾讯云宣布完成对深度求索（DeepSeek）大模型的深度整合——正式上线DeepSeek-R1和V3原版模型的API接口，并创新性接入自研大模型知识引擎，同步开放联网搜索能力。凭借腾讯云在推理并发和生成速率等方面的优化，用户可以获得更加稳定、安全、低门槛的使用体验。开发者只需在云上简单三步即可实现API接口调用，并通过大模型知识引擎提供的文档解析、拆分、embedding、多轮改写等能力，灵活构建专属的AI服务。

2/8/2025 2:09:00 PM

AI在线

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

大语言模型，到底是学会了解决数学问题，还是只是背下了答案？ LLM的「Generalize VS Memorize」之争，迎来最新进展。苏黎世联邦理工的研究员Mislav Balunović，在X上公布了一众顶级AI推理模型在AIME 2025 I比赛中的结果。

2/8/2025 11:44:03 AM

新智元

从 DeepSeek 火热，到李飞飞团队新成果，“幕后高手”竟是它

最近 AI 大模型领域可以说是热点话题不断，DeepSeek 的热潮还未消退，国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议

2/7/2025 2:13:55 PM

汐元

国产大模型DeepSeek爆火，崛起背后大模型专利申请激增

近日，国产大模型DeepSeek爆火全网，凭借“低成本、高性能”的技术优势，其成为全球科技市场关注的焦点。创始人梁文锋介绍，团队主要由国内高校毕业生和没毕业的博士生组成。过硬的创新成果表明，今天的中国，正在成为顶尖人才成长的沃土、原创性创新的策源地。

2/7/2025 1:42:00 PM

AI在线

OpenAI突然公开o3思维链！网友：让我们谢谢DeepSeek

刚刚，OpenAI把o3-mini的推理思维链公开了。从今日起，免费用户和付费用户都可以看到模型的思维过程，OpenAI终于Open一回。图片评论区网友纷纷：让我们谢谢DeepSeek。

2/7/2025 9:05:36 AM

网易有道全面拥抱DeepSeek-R1，推理大模型加速个性化教学升级

1月20日，DeepSeek震撼发布DeepSeek-R1，这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力，同时实现了API调用成本90%-95%的大幅缩减，无疑为科技界投下了一颗开年“重磅炸弹”。 DeepSeek-R1的深度推理能力不仅为AI产业的多元化发展开辟了新航道，也为包括教育在内的多个行业带来了革新动力。作为教育科技企业，网易有道坚持深入挖掘教育场景下的大模型应用价值。

2/6/2025 7:37:00 PM

新闻助手

百度智能云上架DeepSeek R1/V3，上线首日超1.5万家客户调用

2月3日百度智能云宣布 DeepSeek-R1和 DeepSeek-V3模型上架百度智能云千帆平台，并宣布提供行业领先的超低推理价格。模型上线首日，已有超1.5万家客户通过千帆平台进行模型调用。为降低模型使用成本，百度智能云在推理引擎性能优化技术、推理服务工程架构创新以及推理服务全链路安全保障上的进行深度融合。

2/6/2025 6:19:00 PM

新闻助手

在 TKE 上部署 AI 大模型（以DeepSeek-R1为例）

概述本文介绍如何在 TKE 上部署 AI 大模型，以 DeepSeek-R1 为例。部署思路使用 Ollama 运行 AI 大模型，再通过 OpenWebUI 暴露一个聊天交互的界面，OpenWebUI 会调用 ollama 提供的 API 来与大模型交互。 Ollama 与 OpenWebUI 介绍Ollama 是一个运行大模型的工具，可以看成是大模型领域的 Docker，可以下载所需的大模型并暴露 API。

2/6/2025 10:18:45 AM

I am roc roc

DeepSeek 大模型引爆市场：概念股开盘集体涨停

2月5日，A股市场开盘后，DeepSeek 概念股集体爆发，每日互动、美格智能、天娱数科、航锦科技、南威软件等多只股票竞价涨停。此外，飞利信、万兴科技、昆仑万维、海光信息等个股也涨幅靠前。这一市场热潮的背后，是中国 AI 初创公司深度求索（DeepSeek）发布的两款大模型——DeepSeek-V3和 DeepSeek-R1。

2/5/2025 10:50:00 AM

AI在线

消息称阿里引入顶级人工智能科学家或将加码AI To C业务

近期，阿里巴巴在AI领域迎来了一位重量级人物。据业内人士透露，一位全球顶级人工智能科学家已于近期正式入职阿里巴巴，未来或将专注于AI To C业务的基础大模型研发与应用。这位科学家在工业界和学术界均拥有超过20年的经验，尤其在多模态AI领域成果丰硕，曾主导发表过上百篇大模型顶级论文。

2/4/2025 2:08:00 PM

AI在线

硅谷巨头要学会接受：「DeepSeek 现象」只是开始

2025 年的春节无疑已被 DeepSeek 霸屏。过去三年每年的春节都有一次重磅的 AI 讨论：2023 年是 ChatGPT、2024 年是 Sora，这两股风潮都是由 OpenAI 掀起，而 2025 年则是 DeepSeek 的 V3 与 R1。除夕当天 1 月 28 日，DeepSeek 更是趁热发布了文生图模型 Janus-Pro，但后者没有 V3 与 R1 吸引的关注大，原因在于其没有像前者一样动摇了过去基座大模型的「奇迹」来源：算力。

1/31/2025 8:57:00 PM

陈彩娴

ChatGPT回应DeepSeek超越:排名变化或为暂时现象

DeepSeek应用超越ChatGPT，登顶苹果美国区免费App下载排行榜，引发市场热议。这家被称为“大模型版拼多多”的中国公司，其应用的快速上升让海内外技术同行和投资机构都密切关注。对于这一排名变化，ChatGPT回应称，DeepSeek可能在某些方面有独特优势或满足了用户特定需求，但这样的排名变化也许是暂时的，同时也表明AI应用市场竞争激烈，创新空间巨大。

1/28/2025 10:45:00 AM

AI在线

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型全能且实用！实战测评谷歌最新模型Gemini 2.5 Pro 大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战 DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI 模态编码器|CLIP详细解读 50组多风格提示词，全面测评Midjourney V7生图效果！斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习 GPT 开源微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习模态苹果 AI视频驾驶文本搜索 xAI 人形机器人 Copilot 神器推荐 LLaMA 大语言模型具身智能字节跳动 Claude 算力安全应用视频生成科技视觉干货合集亚马逊 2024 AGI 特斯拉 DeepMind 架构

大模型

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

从 DeepSeek 看25年前端的一个小趋势

DeepSeek R1 震撼登场：从介绍到使用

1分钟学会DeepSeek本地部署，小白也能搞定！

为什么中国只有一个 DeepSeek？

OpenAI公开了大模型o3-mini的推理思维链

腾讯云上线DeepSeek全系API接口并打通联网搜索

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

从 DeepSeek 火热，到李飞飞团队新成果，“幕后高手”竟是它

国产大模型DeepSeek爆火，崛起背后大模型专利申请激增

OpenAI突然公开o3思维链！网友：让我们谢谢DeepSeek

网易有道全面拥抱DeepSeek-R1，推理大模型加速个性化教学升级

百度智能云上架DeepSeek R1/V3，上线首日超1.5万家客户调用

在 TKE 上部署 AI 大模型（以DeepSeek-R1为例）

DeepSeek 大模型引爆市场：概念股开盘集体涨停

消息称阿里引入顶级人工智能科学家 或将加码AI To C业务

硅谷巨头要学会接受：「DeepSeek 现象」只是开始

ChatGPT回应DeepSeek超越:排名变化或为暂时现象

消息称阿里引入顶级人工智能科学家或将加码AI To C业务