英伟达点赞DeepSeek:是“出色的人工智能进步”

国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。 这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。 尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。

国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。

这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。

英伟达发言人补充道,推理过程需要大量英伟达GPU和高性能网络支持。英伟达目前掌握三种扩展规律:持续进行的预训练与后训练,以及新的测试时间缩放技术。这一表态也意味着DeepSeek使用的GPU完全符合美国的出口管制要求。

测试时间缩放技术是近年来备受讨论的一个话题,它指出如果一个已完成完整训练的AI模型在预测、生成文本或图像时投入更多计算资源帮助其推理,模型将输出更优质的答案。这一技术已被应用于OpenAI的o1等模型中。

1月27日,美股三大指数收盘涨跌不一,英伟达股价暴跌16.86%,收于每股118.58美元,跌至过去10个月以来的最低点。英伟达总市值2.90万亿美元,一日蒸发5900亿美元,创史上最大单日个股市值蒸发纪录。英伟达的暴跌也使得创始人黄仁勋的身家大幅缩水210亿美元。

在英伟达的带领下,美股半导体芯片板块集体受挫。DeepSeek系量化巨头幻方量化旗下大模型公司,1月20日正式发布推理大模型DeepSeek-R1。R1凭借其出色的性能、开源的性质、大幅下降的售价和训练成本获得了广泛关注。R1的预训练费用只有557.6万美元,在2048块英伟达H800GPU集群上运行55天完成。

划重点: 

📈 DeepSeek应用登顶苹果中国和美国地区应用商店免费APP下载排行榜。

 💬 英伟达评价DeepSeek为AI领域卓越进步,推理需要大量GPU。 

💸 英伟达股价暴跌16.86%,一日蒸发5900亿美元,创史上最大单日个股市值蒸发纪录。

相关资讯

发烧友!一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek

最近,一位软件工程师安纳奈・阿罗拉(Ananay Arora)以 “不到一顿 Chipotle 餐” 的价格购买了域名 OGOpenAI.com,并将其重定向至中国的 AI 实验室 DeepSeek。 这个决定引发了许多人的关注,因为 DeepSeek 近期在开源 AI 领域中取得了显著进展,成为了热议的话题。 DeepSeek 发布的 AI 模型在技术上与早期的 OpenAI 模型相似,能够离线使用,并且任何具备相应硬件的开发者都可以免费使用。

LG 的 Exaone AI 模型以成本效率匹敌DeepSeek

近期,美国知名研究机构 Epoch AI 发布了一份报告,正式将 LG 的 Exaone3.532B 模型评选为 “值得注意的 AI” 之一,并在成本效率方面表现尤为突出,与中国的 DeepSeek 不相上下。 LG Exaone3.5模型于2023年12月正式推出,其开发投资约为70亿韩元(约合480万美元),这一成本低于 DeepSeek 开发其 V3模型所花费的600万美元。 Epoch AI 的评估标准主要考虑了模型的性能、使用频率等因素,而这也是两年来首个获得此类认可的韩国 AI 模型,显示了 LG 在人工智能领域的突破性进展。

DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临

DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。 西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。 去年12月,杭州幻方量化推出DeepSeekV3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 .