DeepSeek 频道：探索人工智能前沿，洞见未来科技

DeepSeek-V3深入解读！

上一篇文章对DeepSeek-R1进行了详细的介绍，今天来看看DeepSeek-R1的基座模型DeepSeek-V3。项目地址：：现有的开源模型在性能和训练成本之间往往难以达到理想的平衡。一方面，为了提升模型性能，需要增加模型规模和训练数据量，这会导致训练成本急剧上升；另一方面，高效的训练和推理架构对于降低计算资源消耗至关重要。

腾讯新搞了个深度思考模型，我们拿它和DeepSeek掐架

AI好好用报道编辑：杨文这波「左右互搏」有看头了。腾讯向来以「慢」著称。无论是游戏、搜索还是音乐、短视频，腾讯都比其他家慢了半拍。

神州信息引入国产开源大模型 DeepSeek

近日，神州信息宣布引入国产开源大模型 DeepSeek，旨在实现其全栈金融解决方案的智能化升级。这一举措不仅标志着技术的迭代，也为银行客户带来了低成本且安全的私域环境部署。通过 DeepSeek 的接入，神州信息旗下九大产品线及30多款关键业务解决方案得到了智能化的全面提升，涵盖了零售客户运营、数字化渠道、开放银行、信贷业务、数据智能及企业级中台等多个领域。

李彦宏解读文心大模型 4.5 开源的意义：开源促进技术普及

在最近的财报电话会上，百度创始人李彦宏就文心大模型4.5系列的开源决策进行了深入的分析。他表示，从其自主研发的 DeepSeek 项目中，百度深刻认识到开源的最佳模型将大大推动用户的使用和接受程度。当一个强大的模型实现开源时，自然会吸引更多的人出于好奇心进行尝试，这样的行为不仅能够促进技术的普及，也会带来更广泛的应用。

Deepseek 这么厉害，普通人怎么用好它？

最近，Deepseek 的风头可谓是一时无两，相关消息一波接着一波。它强大的能力让人惊叹不已，写代码、做翻译、生成文案……简直无所不能！不少小伙伴跃跃欲试，却又担心自己不是程序员、不会写代码，用不好这么“高大上”的工具。

掀桌子了！DeepSeek开源“双脑模型”Janus-Pro：左脑识图，右脑画图！

DeepSeek 这次直接把桌子掀了！继把大模型价格打到地板价后，他们最新开源的多模态模型更狠——不仅看得懂《清明上河图》的细节，还能照着你的描述生图。这个多模态模型就是他们悄悄开源的“双脑”视觉模型 Janus-Pro，被称为“左脑能当福尔摩斯解密图片，右脑能当画家挥毫泼墨。

短期高估、长期低估：微信接入DeepSeek的产品深度思考

微信搜索接入 DeepSeek 后，我看到了太多 DeepSeek 生成的水文，也看到了太多“王炸”、“里程碑”、“深水炸弹”、“重构 AI 搜索”、“游戏终结”等虎狼之词。比如这篇，直接把 DeepSeek 幻觉搬上来了. 实在忍不住了，决定出来基于事实和逻辑来一版的冷静分析。

DeepSeek-R1详细解读！

DeepSeek-R1爆火，今天来详细看下。论文地址：：：：现有LLMs在推理任务上的改进主要依赖监督微调（SFT）和后训练（Post-Training）方法，但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链（Chain-of-Thought, CoT）提升了性能，但其测试时扩展仍存在挑战。

一、分享背景DeepSeek近日红的发紫，春节前发现一个叫Deepseek的LLM送 10 RMB的Token!!!，正巧符合生产工作中拥抱大模型的主旋律，又本着有羊毛必薅的原则配合B站ollama本地部署喂饭视频起了阿里qwen2.5(1.5b）就行Coding辅助。 ollama本地部署Coding模型复制step2:step3:效果：二、工具需求分析GUI化，免去命令行操作，12-80年龄段各类人群均适用。固定的LLM回复结果，使每一次提问都能得到相同格式的回答（区分在线提问和工具脚本的关键)。

超简单：三步教你搞定DeepSeek本地部署

最近，国产AI神器DeepSeek爆火，其深度思考能力完美的体现了DeepSeek先进的算力和优越的性能。可以这么说，DeepSeek的问世，推动了AI大模型的跨越式发展。作为一款AI领域的现象级产品，DeepSeek的用户量在短时间内暴增，服务器也被大量攻击，不少小伙伴在使用DeepSeek时，经常会出现服务器繁忙的提示。

网易云音乐接入 DeepSeek-R1 大模型，用于歌曲智能推荐等领域

网易云音乐18日宣布，其面向创作者研发的“音乐播客生成工具”与“对谈播客生成工具”已完成国产开源大模型DeepSeek-R1的全能力接入。

新手必看：用DeepSeek轻松产出爆款，三分钟掌握自媒体全流程

今天来分享如何利用 DeepSeek 高效创作自媒体文章，自媒体账号的打造和内容创作是一个系统性工程。本文将详细拆解如何利用 DeepSeek 完成从账号定位到爆款内容创作的全流程，帮助你快速脱颖而出。一、账号定位与赛道分析：知己知彼，精准切入1.

荣耀手机 YOYO 助理灰度更新“深度思考”功能

荣耀手机 YOYO 助理正灰度更新“深度思考”功能（YOYO 助理需更新至 90.0.1.406 版本、语音服务需更新至 9.0.0.177 版本），用户更新后可在对话框处点击 YOYO 头像启用 / 关闭深度思考功能。

一加手机陆续安排接入 DeepSeek 满血版

一加中国区总裁李杰今日发文确认，一加品牌机型正陆续安排接入 DeepSeek。并且他表示接入的 DeepSeek 模型为“满血版”。

理想同学App全新升级，接入DeepSeek R1与V3模型

近日，“理想同学” APP 发布了重要更新，宣布接入 DeepSeek 的 R1 和 V3 模型。这一升级为用户带来了更加丰富的功能，特别是在深度思考和联网搜索方面的能力提升。用户可以通过 APP 首页右下方的切换功能，体验 R1 模型所带来的深度思考、联网搜索和连续对话等丰富功能。

DeepSeek 推出 NSA 技术：加速长上下文训练与推理

在人工智能领域，DeepSeek 团队于近日发布了最新研究成果，推出了一种名为 NSA（Native Sparse Attention）的创新稀疏注意力机制。这项技术的核心目标是提升长上下文训练和推理的速度，特别是针对现代硬件进行了优化，使得训练和推理的效率大幅提升。 NSA 技术的推出，为人工智能模型的训练带来了显著的变化。

理想同学 App 接入 DeepSeek R1 & V3 模型，支持深度思考、联网搜索功能

据多位微博用户分享及理想汽车第一产品线总裁汤靖确认，理想同学 App 已接入 DeepSeek R1 & V3 模型（内测版 V1.2.0），支持深度思考、联网搜索、连续对话等功能。

刚刚！DeepSeek梁文锋亲自挂名，公开新注意力架构NSA

DeepSeek 新论文来了！相关消息刚刚发布到 𝕏 就吸引了大量用户点赞、转发、评论三连。据介绍，DeepSeek 的这篇新论文提出了一种新的注意力机制 ——NSA。

DeepSeek 频道：探索人工智能前沿，洞见未来科技 - AI在线

DeepSeek-V3深入解读！

腾讯新搞了个深度思考模型，我们拿它和DeepSeek掐架

神州信息引入国产开源大模型 DeepSeek

李彦宏解读文心大模型 4.5 开源的意义：开源促进技术普及

Deepseek 这么厉害，普通人怎么用好它？

掀桌子了！DeepSeek开源“双脑模型”Janus-Pro：左脑识图，右脑画图！

短期高估、长期低估：微信接入DeepSeek的产品深度思考

DeepSeek-R1详细解读！

基于Deepseek的安全分析工具设计实践

超简单：三步教你搞定DeepSeek本地部署

网易云音乐接入 DeepSeek-R1 大模型，用于歌曲智能推荐等领域

新手必看：用DeepSeek轻松产出爆款，三分钟掌握自媒体全流程

荣耀手机 YOYO 助理灰度更新“深度思考”功能

一加手机陆续安排接入 DeepSeek 满血版

理想同学App全新升级，接入DeepSeek R1与V3模型

DeepSeek 推出 NSA 技术：加速长上下文训练与推理

理想同学 App 接入 DeepSeek R1 & V3 模型，支持深度思考、联网搜索功能

刚刚！DeepSeek梁文锋亲自挂名，公开新注意力架构NSA

DeepSeek 频道：探索人工智能前沿，洞见未来科技 - AI在线

DeepSeek-V3深入解读！

腾讯新搞了个深度思考模型，我们拿它和DeepSeek掐架

神州信息引入国产开源大模型 DeepSeek

李彦宏解读文心大模型 4.5 开源的意义：开源促进技术普及

Deepseek 这么厉害，普通人怎么用好它？

掀桌子了！DeepSeek开源“双脑模型”Janus-Pro：左脑识图，右脑画图！

短期高估、长期低估：微信接入DeepSeek的产品深度思考

DeepSeek-R1详细解读！

基于Deepseek的安全分析工具设计实践

超简单：三步教你搞定DeepSeek本地部署

网易云音乐接入 DeepSeek-R1 大模型，用于歌曲智能推荐等领域

新手必看：用DeepSeek轻松产出爆款，三分钟掌握自媒体全流程

荣耀手机 YOYO 助理灰度更新“深度思考”功能

一加手机陆续安排接入 DeepSeek 满血版

理想同学App全新升级，接入DeepSeek R1与V3模型

​DeepSeek 推出 NSA 技术：加速长上下文训练与推理

理想同学 App 接入 DeepSeek R1 & V3 模型，支持深度思考、联网搜索功能

刚刚！DeepSeek梁文锋亲自挂名，公开新注意力架构NSA

DeepSeek 推出 NSA 技术：加速长上下文训练与推理