“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷,巨头进入恐慌模式,外媒刷屏,大佬发声:中国AI已追上美国

短短一个月内,中国AI初创公司深度求索(DeepSeek)先后发布了DeepSeek-V3和DeepSeek-R1两款大模型,成本价格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。

Scale AI创始人Alexander Wang在1月24日的采访中表示,DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。

此前,Alexander Wang评价说,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

此外,中国AI“刷屏”国外各大媒体,它们认为中国大模型的新进展为硅谷敲响了警钟。

在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,让人们质疑,AI行业数千亿美元资本的巨额投入真的是最有效的方法吗?

Meta进入恐慌模式,试图复制DeepSeek

1月24号,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

这位Meta员工写道:

“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。

工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。

管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?

DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。”

去年12月27日,DeepSeek推出开源模型DeepSeek-V3。当时,聊天机器人竞技场(Chatbot Arena)显示,DeepSeek-V3在所有模型中排名第七,在开源模型排第一。而且,DeepSeek-V3是全球前十中性价比最高的模型。

不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型,允许所有人在遵循MIT License(注:被广泛使用的一种软件许可条款)的情况下,蒸馏R1训练其他模型。

1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。

在高难度提示词、代码和数学等技术性极强的领域,DeepSeek-R1拔得头筹,位列第一。

在风格控制方面,DeepSeek-R1与o1并列第一,意味着模型在理解和遵循用户指令,并按照特定风格生成内容方面表现出色。

在高难度提示词与风格控制结合的测试中,DeepSeek-R1与o1也并列第一,进一步证明了其在复杂任务和精细化控制方面的强大能力。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

Artificial-Analysis对DeepSeek-R1的初始基准测试结果也显示,DeepSeek-R1在AI分析质量指数中取得第二高分,价格是o1的约三十分之一。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

AI大佬惊叹:中国AI已追上美国

去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

著名投资公司A16z的创始人马克·安德森1月24日发文称,Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

1月24日,A16z合伙人、Mistral AI董事会成员Anjney Midha表示:“从斯坦福到麻省理工,DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。”

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

对于中国AI为何能有如此快速的进展,诺奖得主、“AI教父”杰弗里·辛顿在1月21日接受博主Curt Jaimungal专访中表示,中国的STEM(科学、技术、工程、数学)教育比美国更好,拥有更多受过良好教育的人才,这将为AI的发展提供坚实的基础。尽管美国试图通过限制(如英伟达芯片)来减缓中国的发展,但这只会促使中国加速发展自己的技术,“他们可能会落后几年,但最终会赶上”。

DeepSeek或彻底改变游戏规则,“大力出奇迹”还有效吗?

斯坦福大学和Epoch AI的研究人员去年年中发表了一项研究表明,到2027年,最大型的模型的训练成本将超过10亿美元。Gartner预测,到2028年Google、Microsoft和AWS等超大规模企业仅在AI服务器上的支出就将高达5000亿美元。

但DeepSeek完全不同,它的训练成本并不昂贵。Noah's Arc资本管理公司表示,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。

特别是在5000亿美元的“星际之门”计划公布后,DeepSeek更让人怀疑,巨额投入这种“大力出奇迹”的办法真是最有效的方法吗?

美股大V“THE SHORT BEAR”1月24日在X上发文称,DeepSeek给AI巨头们带来了痛苦时刻,投资者必须对此敲响警钟。

他说:“如果击败OpenAI只需要5500万美元,那么这个行业的商业化会比很多人预想的要快很多。”

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

他还指出:“根据红杉,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。现在看来,这种冒险行为变得越来越无利可图。”

著名财经记者Holger Zschaepitz 1月25日表示,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,这让人们质疑该行业数千亿美元资本支出的效用。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

有投资者甚至认为,美股芯片股的股价也会面临挑战。

投资者Geiger Capital表示,Deepseek和OpenAI一样好,甚至更好,而且价格只有后者的3%……而美国公司却投入了数千亿美元。那么……纳斯达克会怎样呢?

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

值得注意的是,DeepSeek-V3发布后,英伟达股价下跌了2%。而DeepSeek-R1引发海外大讨论后,1月24日英伟达股价又大跌了3.12%。

外媒集体刷屏:给硅谷敲响警钟

如果说DeepSeek-V3只是掀起了波澜,那么DeepSeek-R1则是引发了轰动。最近四天,国外媒体纷纷聚焦DeepSeek,并一致认为中国大模型的新进展为硅谷敲响了警钟。

1月22日,美国媒体Business Insider报道称,DeepSeek-R1模型秉承开放精神,完全开源,为美国AI玩家带来了麻烦。开源的先进AI可能挑战那些试图通过出售技术赚取巨额利润的公司。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

1月24日,美国媒体CNBC推出了长达40分钟的节目,邀请了Perplexity CEO Aravind Srinivas来分析为何DeepSeek会引发人们对美国在AI领域的全球领先地位是否正在缩小的担忧。

英国《金融时报》1月25日报道称,中国小型AI初创公司DeepSeek震惊硅谷。报道聚焦资源更丰富的美国AI公司能否捍卫自己的技术优势。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷

报道援引加州大学伯克利分校AI政策研究员Ritwik Gupta称,DeepSeek最近发布的模型表明“AI能力没有护城河”。Gupta补充说,中国的系统工程师人才库比美国大得多,他们懂得如何充分利用计算资源来更便宜地训练和运行模型

相关资讯

有把握收入从1亿做到数亿!李开复最新回应25年调整:大厂才烧得起超大模型;第一年的打法已不再适用,AI应用爆发前夜公司要提前卡位

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)在零一万物深陷“收购风波”时,李开复第一时间在朋友圈进行了澄清。 与此同时,他一口气接受了多个采访,通过披露更多信息来攻破谣言。 图片关于零一万物预训练团队和Infra团队的去向已经明晰:愿意继续训练超大参数模型的成员,可以加入零一和阿里云合作成立的“产业大模型联合实验室”。

一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo

开源大模型领域,又迎来一位强有力的竞争者。近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE) 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。项目地址::DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language ModelDeepSeek-V2 参数量达 236B,其中每个 token 激活 21B 参数,支持 128K token 的上下文长度。与

DeepSeek开源数学大模型,高中、大学定理证明新SOTA

DeepSeek-Prover-V1.5 通过结合强化学习和蒙特卡洛树搜索,显著提升了证明生成的效率和准确性。AI 技术与数学发现的进展,正前所未有地交织在一起。前段时间,著名数学家陶哲轩在牛津数学公开讲座中做了主题为「AI 在科学和数学中的潜力」的主题分享。他指出,将 AI 整合到数学领域将使形式化证明的编写速度超过人类证明(人类证明容易出错)。这将成为一个关键转折点,意味着形式化证明的使用将不仅限于验证现有的证明,还将用于创造新的数学知识。这将通过广泛的人类数学家与 AI 数学家之间的协作来实现。我们将迎来一个