DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。 目前,新版本在 Hugging Face 上可以下载并部署。 Hugging Face 地址:,DeepSeek-V3-0324 没有公布详细的模型卡。

昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。

目前,新版本在 Hugging Face 上可以下载并部署。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main

不过,DeepSeek-V3-0324 没有公布详细的模型卡。我们只能看到它的参数为 6850 亿以及张量类型。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

此外,DeepSeek-V3-0324 支持了更宽松的 MIT 开源协议。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

模型放出来后,DeepSeek-V3-0324 的代码能力让所有人震惊了!

有人表示,经过自己的测试,DeepSeek-V3-0324 在数学推理和前端开发方面的表现优于 Claude 3.5 和 Claude 3.7 Sonnet。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

图源:https://x.com/selcukemiravci/status/1904311856313028870

X 博主「@KuittinenPetri」表示,Anthropic 和 OpenAI 陷入了困境。更新后的 DeepSeek-V3-0324 可以轻松免费地创建漂亮的 HTML5、CSS 和前端。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

图源:https://x.com/KuittinenPetri/status/1904224441384771909

提示词如下:为 AI 公司「NexusAI」创建一个外观精美的响应式首页,将所有内容包含在一个 HTML5 文件中。结果如下图所示,所有图像,包括用户故事和他们的面孔,一切都是用这个提示完成的。 

他认为:DeepSeek-V3-0324 是 DeepSeek 最好的非推理模型,通常更适合创意写作任务,但现在也比 R1 更适合制作 HTML5 + CSS + 前端。上述提示的结果代码总共 958 行,但它实际上实现了一个交互式网站,包括所有图像。并且结果也适用于移动设备。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

图片编辑助手-2025325-1742857573047.png

他还称,DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

这位网友还把提示语放出来了,简单的几行字,大家可以前去一试。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

Hyperbolic 联合创始人兼 CTO Yuchen 称自己的氛围测试显示,DeepSeek- V3-0324 已经有了一些思维链模型的影子。

他测试了题目「strawberry 中有多少个 r」,可以看到,DeepSeek-V3-0324 展示了详细的推理步骤。他表示,真正的「Open AI」又赢了。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

图源:https://x.com/Yuchenj_UW/status/1904223627509465116

还有人将 DeepSeek-V3-0324 与 OpenAI o1-pro 生成小球的效果进行了比较。下面是 o1-pro 的效果:

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

他表示,DeepSeek-V3-0324 大约可以实现 o1-pro70% 的性能,但它免费并且 API 价格比后者便宜了至少 50 倍。二者选谁一目了然!

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

图源:https://x.com/michaelkaoi/status/1904178015833297342

X 博主「orange.ai」对 DeepSeek V3、DeepSeek-V3-0324 与 Claude Sonnet 3.7 的海报设计结果进行了比较,同样表示前端代码能力相比上代有了显著增强。

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

图源:https://x.com/oran_ge/status/1904306405823467526

相关资讯

DeepSeek正在杀死程序员?不,它杀死的是一整个时代

——从“人肉编码”到“AI工程化”,中国软件行业的范式革命已至导语:当技术革命的枪声响起2023年GitHub统计显示,中国开发者平均每天写300行代码,其中270行是重复性业务逻辑。 而在DeepSeek等AI编码工具冲击下,这种“人肉堆代码”的模式正在崩塌——某跨国IT服务商已裁撤40%初级Java岗位,同时开出百万年薪急招AI工程师。 这不是简单的工具替代,而是一场关乎行业生死存亡的认知革命。

DeepSeek开源第三弹:惊人的300行代码驱动R1和V3的训练与推理,超越各种专家内核

DeepSeek开源周第三弹! DeepSeek-AI 重磅发布高效FP8 GEMM库 DeepGEMM:极致性能,代码精简,助力V3/R1模型训练与推理! 简单来说这是由 DeepSeek-AI 团队精心打造的 FP8 通用矩阵乘法 (GEMM) 加速库,专为追求极致性能和代码简洁而生我们一起来扒一扒:Hopper GPU 上狂飙 1350 FP8 TFLOPS!

你的提示词根本只是在浪费算力,如何让Deepseek发挥极限潜能 - 多跳推理

最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 对于deepseek的流弊:小部分人会关心,deepseek为什么这么流弊;大部分人会关心,提示词要怎么写;今天和大家聊聊,deepseek的核心机制之一的多跳推理,以及如何优化我们的提示词,使得deepseek能够最大化发挥其多跳推理的潜力。 什么是多跳推理?