美国恐惧:冷战2.0将至,中国开源模型大爆炸临近!LeCun:DeepSeek只是卷王副产品

如今,美国已经开始陷入「冷战2.0焦虑」——我们的AI技术,恐怕已经落后于中国了? 甚至AI社区的不少人已经押注:接下来几个月,将有一大波中国开源AI模型的浪潮! 某AI大V如是说:一年前,没有人会预料到,在AI竞赛中,美国竟会被更强大的中国超越。

如今,美国已经开始陷入「冷战2.0焦虑」——我们的AI技术,恐怕已经落后于中国了?

甚至AI社区的不少人已经押注:接下来几个月,将有一大波中国开源AI模型的浪潮!

图片

某AI大V如是说:一年前,没有人会预料到,在AI竞赛中,美国竟会被更强大的中国超越。如今,这种恐慌已经弥漫开来,更加显而易见。

图片

下面这张图片,愈发成为如今的现实。

图片

一位大V呼吁道:如果中国赢得技术竞赛,那他们也会赢得经济和其他领域的竞赛。届时,他们将成为世界上的主导力量,我们不能让这种情况发生!

因此,如果美国现在还想赶上中国、击败他们,就需要无限的能源、无限的算力和更简单的立法。

LeCun附议:DeepSeek击败美国,不过是中国内部竞争的副产品

科技大V、天使投资人、技术创始人Balaji已经预测到,接下来几个月里,中国还会有一波开源AI模型的浪潮,涵盖从计算机视觉到机器人技术,再到图像生成的各个领域。

图片

这是一种AI的生产过剩。

他之所以做出这种判断,是因为从公开声明中推断出,很明显中国的目标是让AI软件不再有利润,因为他们在通过AI硬件赚钱。

他认为,对于美国科技产业(这个最后的堡垒),中国想复制他们已经对美国制造业做过的事情——复制它、优化它、规模化生产,然后用低价击垮原版。

图片

在他看来,整件事的内在逻辑,是这样的。

1.中国注意到,DeepSeek的发布曾一度让美国科技公司的市值蒸发了大约一万亿美元。2.中国的核心优势一直是出口实体产品,而非软件。3.中国的另一项核心竞争力是以极大规模出口商品,直到所有外国生产商被压垮,他们就能主导市场,就像他们对德国和日本汽车产业所做的。4.DeepSeek的出现,让中国有了信心,认为在AI领域拿下世界第一,已经是可能实现的目标。5.DeepSeek已经在中国迅速走红,其开源特性意味着每个人都可以快速接入。6.如今,DeepSeek可能已经拥有了无限的资源支持。

综合这一切来看,中国现在认为自己已经抓住了这样的机会:打击美国科技公司、拉动内部经济、从全球AI软件(至少是在模型层面)中抽走利润空间。

而在那之后,则是通过销售价格低廉、质量过硬的AI硬件来赚钱,比如智能家居、自动驾驶汽车、消费级无人机和机器狗。

从上面这些叙述可以看出,美国人看待这件事的角度可谓是十分「酸鸡」。

总之,在做过一番预测后,Balaji表示,自己不知道中国是否能在应用层取得成功。

但对那些开发封闭源代码AI模型的公司来说,显然他们亏惨了。因为,他们已经很难收回训练SOTA模型所需的高昂固定成本,尤其是如今在开源好模型层出不穷的情况下。

总之,中国如今成了开源AI的先锋,这实在令人惊讶。

然而内部逻辑却是一致的:因为中国专注于不择手段地赢,这就意味着他们需要复制一些已经被西方放弃的价值观,比如开源,而这曾经被认为是最难模仿的。

最后,Balaji十分不情愿地表示:不得不承认,中国在软件上的进步速度,已经超过了西方在硬件上的进步速度。

对于Balaji这居高临下的言论,是时候拿出LeCun曾经的这番话,来回怼他们一番了——

图片

「硅谷圈子的常见病,就是一种错位的优越感。高级阶段的症状,是认为小圈子就能垄断好的想法」

并且这次,LeCun依然转发了类似论调的观点,强调中国并不是一个协调一致的单一实体,而是一个竞争异常激烈的国内市场,企业家们时刻怀揣着梦想,也怀揣着被人赶上的恐惧。

所以,击败美国不过是中国内部竞争的副产品而已。

图片

不过,对于Balaji的判断,还是不少人表示赞同,尤其是「硬件是中国科技扩展到全球市场的主要渠道」。

图片图片

有人表示,所以美国现在的对策就是停止训练基础模型,完全专注于微调和构建app。训练基础模型,已经是整个AI产业中最昂贵、利润最低的部分,所以最不划算。

图片

Aitomatic CEO、港科大教授Christopher Nguyen对此评价道:你的很多客观见解都很有道理,但我认为你的观点太过「美国中心主义」了。

如果想要更贴近中国视角地来理解这件事,就要明白——我们对他们的关注,远远多于他们对我们的关注。

图片

要知道,中国的公司和技术人员一直在大力投入开源项目(比如Linux基金会,或深圳的机器人产业),他们也一向致力于以更高质量和最低成本「击败」竞争对手——在彼此之间,他们的竞争都一直很激烈。

可以说,在中国,这种氛围并不是出于某种国家层面的统一工业政策,而是源于纯粹的、激烈的市场竞争和技术创新。

Nguyen教授举例说,自己就曾在松下领导一个工业级的AI项目。当时松下中国内部的说法就是,他们必须用「中国速度」来做事——比全球其他地区更快、更精简、更强硬,根本等不起全球总部的节奏。

他建议说,你们应该试着从中国自身多元的视角去理解中国,而不是把美国放在他们的宇宙中心。

图片

美国已落后于中国,必须迎头赶上!

Facebook前高管、Social Capital创始人兼CEO Chamath Palihapitiya也表示,中国在很多方面已经全面领先美国。

图片

如果美国还想赶上中国、击败他们,就需要无限的能源、无限的算力和更简单的立法。

图片

「无限的能源」,意味着在维持现有政策(如投资税收抵免和可转让性)的基础上,同时尽可能批准各类新型能源项目,包括天然气、煤炭、核能、风能和太阳能等所有模式。

「无限的算力」,意味着要迅速将对台湾省芯片制造的依赖转移到美国本土。

「更简化的立法」就更简单了,如今繁杂且相互矛盾的法律法规让高效推进变得几乎不可能。因此每制定一条新规,就应废除十条旧规。

总之,如果迅速行动,赢得这场竞赛还是有可能的。

图片

很多人呼吁,现在,美国应该解除对所有技术、AI、机器人和能源行业的管制,像在太空竞赛时那样,重新投资STEM。

图片图片

而削减国家科学基金会(NSF)和国立卫生研究员(NIH)的预算、削减研究经费,显然是南辕北辙的做法。

图片

比尔盖茨:DeepSeek创新的开放性,我从未见过

如今,已经有越来越多的大佬看好中国AI的发展势头。

比如最近在访谈中,比尔盖茨就表示,非常看好DeepSeek的创新能力。

图片

在访谈中,他表示,中国拥有非常强大的大学,可以开展深入的研究。

而DeepSeek所做的其实并不罕见,但它们做了一件非常聪明的事,让所有人都看到了。

不过比尔盖茨强调说,这种创新的开放性,以及DeepSeek所打破的数字纪录,的确是他从未见过的。

而且,因为如今最先进的技术基本都已经开源,尽管它们大部分来自中国和美国,但没有人真正落后。

不过,对于中美AI竞赛,他的预测是只要美国能控制住台积电,美国就不会输。

软件爆炸在美国,全栈AI大爆炸在中国?

AI竞赛最终的胜出者是谁,最近硅谷投资人Tom Davidson等人的长文预测中,也有提到。

图片

他们分析道,如今AI已经会改进算法和软件,提高AI芯片的质量,同时提高芯片的产量。

这些过程,会形成几种循环,周期分别是3个月、数月,以及数年。相对应的,就是软件大爆炸、AI技术大爆炸,和全栈大爆炸!

图片

作者通过计算给出了惊人的结论:在到达AI到达物理极限之前,这些反馈循环最终将导致有效计算能力增加13到33个数量级。

最终,爆炸性的结论来了——AI在达到有效的物理极限之前,能进步到什么程度?

答案是,软件效率可能提升大概13个数量级,也就是1000亿倍;芯片技术可能提升100倍左右;芯片制造规模可能扩大1万倍左右!

图片

所以,哪些国家会率先达到这些进步?

在博客中,几位作者给出了这样的预测——

软件大爆炸,最有可能出现在美国,因为这些AI芯片和算法的所有者掌握着高度集中的权力。

AI技术爆炸,最有可能出现在美国和半导体供应链中的其他国家和地区,比如台湾省、韩国、日本、荷兰,而权力会更广泛地分布在AI算法、AI芯片和半导体供应链所有者之间。

而全栈爆炸,更有可能发生在中国和海湾国家等拥有强大工业基础的国家,这种爆炸也会将权力更广泛地分布在整个工业基础中。

相关资讯

微软等开源AIOpsLab,可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了,一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务,实现故障的自动化检测、定位和解决问题。 还具备高度的可观测性,能够收集和分析关键的遥测数据,确保对系统状态和应用环境的深入洞察。

DeepSeek开源Janus-Pro-7B:多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

中国人工智能公司 DeepSeek 的 R1“推理”人工智能已经引起了广泛关注,位居应用商店排行榜首位并改变了股市。 随后DeepSeek又宣布开源新一代多模态模型Janus-Pro-7B,该模型在图像生成、视觉问答等任务中全面超越 OpenAI 的 DALL-E 3 和 Stable Diffusion 3,并以“理解-生成双路径”架构和极简部署方案引发AI社区轰动。 性能表现:小模型吊打行业巨头Janus-Pro-7B虽仅有70亿参数(约为GPT-4的1/25),却在关键测试中碾压对手:文生图质量:在GenEval测试中以80%准确率击败DALL-E 3(67%)和Stable Diffusion 3(74%)复杂指令理解:在DPG-Bench测试中达84.19%准确率,能精准生成如“山脚下有蓝色湖泊的雪山”等复杂场景多模态问答:视觉问答准确率超越GPT-4V,MMBench测试得分79.2分接近专业分析模型技术突破:像“双面神”分工协作传统模型让同一套视觉编码器既理解图片又生成图片,如同让厨师同时设计菜单和炒菜。

李飞飞、DeepSeek为何偏爱这个国产模型?

斯坦福李飞飞团队的一篇论文,近来在AI圈子掀起了一场飓风。 他们仅用1000个样本,在16块H100上监督微调26分钟,训出的新模型s1-32B,竟取得了和OpenAI o1、DeepSeek R1等尖端推理模型相当的数学和编码能力! 团队也再次证明了测试时Scaling的威力。