出品 | 51CTO技术栈(微信号:blog51cto)
刚刚,DeepSeek放出了更新模型的官方报告,并发推文:
🚀 DeepSeek-V3-0324 现已推出!
🔹推理能力大幅提升
🔹更强的前端开发技能
🔹更智能的工具使用能力
✅对于非复杂推理任务,我们建议使用 V3 — 只需关闭“DeepThink”
🔌 API 使用保持不变
📜模型现在根据 MIT 许可证发布,就像 DeepSeek-R1 一样!
报告细节已经可以在HF上进行查看:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
💫模型参数:685B
✨更新版V3的几项改进:
1.推理能力
基准测试表现显著提升:
2.前端 Web 开发
- 提高代码的可执行性
- 生成更美观的网页和游戏前端
3.中文写作能力 风格和内容质量提升
- 符合 R1 写作风格
- 中长篇写作质量更优
4.功能增强
- 多轮交互改写能力提升
- 翻译质量和书信写作优化
5.中文搜索能力
- 报告分析请求的输出更加详细
6.函数调用改进
- 函数调用准确率提升,修复了 V3 版本中的相关问题
在推文下,海外网友纷纷在评论区“催更”DeepSeek-R2!
相信不久的将来,DeepSeek就会给我们想要的惊喜吧!