DeepSeek-V

更新版DeepSeek-V3官方报告出炉！模型参数685B!数学、代码性能击败GPT-4.5

出品 | 51CTO技术栈（微信号：blog51cto）刚刚，DeepSeek放出了更新模型的官方报告，并发推文：🚀 DeepSeek-V3-0324 现已推出！ 🔹推理能力大幅提升🔹更强的前端开发技能🔹更智能的工具使用能力✅对于非复杂推理任务，我们建议使用 V3 — 只需关闭“DeepThink”🔌 API 使用保持不变📜模型现在根据 MIT 许可证发布，就像 DeepSeek-R1 一样！报告细节已经可以在HF上进行查看：💫模型参数：685B✨更新版V3的几项改进：1.推理能力基准测试表现显著提升： 2.前端 Web 开发- 提高代码的可执行性 - 生成更美观的网页和游戏前端 3.中文写作能力风格和内容质量提升 - 符合 R1 写作风格 - 中长篇写作质量更优 4.功能增强 - 多轮交互改写能力提升 - 翻译质量和书信写作优化 5.中文搜索能力- 报告分析请求的输出更加详细 6.函数调用改进- 函数调用准确率提升，修复了 V3 版本中的相关问题在推文下，海外网友纷纷在评论区“催更”DeepSeek-R2!相信不久的将来，DeepSeek就会给我们想要的惊喜吧！

3/26/2025 7:14:33 AM

DeepSeek-R1详细解读！

DeepSeek-R1爆火，今天来详细看下。论文地址：：：：现有LLMs在推理任务上的改进主要依赖监督微调（SFT）和后训练（Post-Training）方法，但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链（Chain-of-Thought, CoT）提升了性能，但其测试时扩展仍存在挑战。

2/19/2025 8:00:00 AM

GoldMa

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练