DeepSeek

DeepSeek-R1 持续刷屏,连 Open R1 都来了!抱抱脸发起,1 天狂揽 1.9k 星

现在,这股 Open 的风也是反向吹起来了,最新目标,正是国产大模型 DeepSeek-R1。

物理测试暴击AI圈,DeepSeek R1稳超o1、Claude,我们已进入RL黄金时代

我们都没预料到,AI 领域的 2025 年是这样开始的。 DeepSeek R1 真是太厉害了! 最近,「神秘的东方力量」DeepSeek 正在「硬控」硅谷。

DeepSeek-R1 持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看

刚刚,DeepSeek-R1 跻身大模型竞技榜前三。以开源、便宜 20 倍的“身价”与 ChatGPT-4o(2024.11.20)并列。

周鸿祎:中美 AI 竞争愈演愈烈,中国必将胜利

360公司的创始人周鸿祎在社交媒体上发表帖子,谈及中美在人工智能(AI)领域的激烈竞争。 他指出,当前中美之间的 AI 竞争正日益加剧,但他坚信最终中国会取得胜利。 他提到,正如中国在制造业领域已经超越美国一样,未来在 AI 技术方面也将迎来类似的成功。

DeepSeek R1来袭,Meta 高管都慌了

近日,Meta 的工程师们在匿名社交平台 TeamBlind 上吐露心声,揭示了中国公司 DeepSeek 所研发的 AI 模型 R1所带来的巨大压力。 DeepSeek 被认为是全球首个与 OpenAI 的 o1模型相提并论的开源 AI 模型,而与 OpenAI 相比,R1不仅开源程度更高,而且训练成本低得惊人,仅为550万美元。 相比之下,Meta 的高管年薪常常超过整个 DeepSeek V3的训练成本,这使得 Meta 的管理层倍感尴尬。

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。 」DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。 最先陷入恐慌的,似乎是同样推崇开源的 Meta。

发烧友!一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek

最近,一位软件工程师安纳奈・阿罗拉(Ananay Arora)以 “不到一顿 Chipotle 餐” 的价格购买了域名 OGOpenAI.com,并将其重定向至中国的 AI 实验室 DeepSeek。 这个决定引发了许多人的关注,因为 DeepSeek 近期在开源 AI 领域中取得了显著进展,成为了热议的话题。 DeepSeek 发布的 AI 模型在技术上与早期的 OpenAI 模型相似,能够离线使用,并且任何具备相应硬件的开发者都可以免费使用。

程序员购买OGOpenAI.com域名转向DeepSeek

最近,一名软件工程师以 “不到一顿 Chipotle 餐的价格” 购买了 OGOpenAI.com 域名,并将其重定向至中国人工智能实验室 DeepSeek 的网站。 该实验室在开源 AI 领域崭露头角,吸引了广泛的关注。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他的初衷是为了支持 DeepSeek,因为该实验室最近推出了一款名为 DeepSeek-R1的开放版本模型,声称在某些基准测试中表现优于 OpenAI 的 o1。

DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临

DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。 西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。 去年12月,杭州幻方量化推出DeepSeekV3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 .

软件工程师购得“OGOpenAI.com”域名,将其重定向至 DeepSeek 官网

一位软件工程师购得了“OGOpenAI.com”域名,并将其重定向至中国人工智能实验室 DeepSeek 的官网。DeepSeek 近期在开源 AI 领域引起了大量关注,其发布的先进开源 AI 模型获得广泛赞誉。

DeepSeek-R1 最新发布,剑指 OpenAI o1

昨日 1 月20 号,DeepSeek 团队推出了全新开源模型 DeepSeek-R1,一夜之间模型就在 Github 上收获了 4k star,引爆大模型领域。 而这次的 R1 模型一出,不仅反驳了之前蒸馏 OpenAI o1 的说法,官方更是直接下场表示:“我们可以和开源版的 o1 打成平手”。 值得一提的是, R1 突破了以往的模型训练形式,完全没有使用任何 SFT 数据,仅通过纯粹的 RL 来训练模型,这一点说明 R1 已经学会了自己思考问题——这实则更符合人类的思维规则。

DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版

幻方量化旗下 AI 公司深度求索(DeepSeek)今日正式发布 DeepSeek-R1 模型,并同步开源模型权重。据官方介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

DeepSeek R1 Preview 模型亮相,代码能力与 OpenAI o1 相当且确认开源

还未正式发布,已在代码基准测试 LiveCodeBench 霸榜前三,表现与 OpenAI o1 的中档推理设置相当。

全网都在扒的DeepSeek团队,是清北应届生撑起一片天

DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。 紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。 这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?

从DeepSeek-V3发布谈大模型的技术突破与未来机遇

在AI技术日新月异的今天,大型语言模型已成为推动AI发展的重要力量。 2024年12月26日,DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3。 这款开源模型采用了高达6710亿参数的混合专家(MoE)架构,每秒能够处理60个token,比V2快了3倍。

DeepSeek的V3,爆火了

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)上周四,12月26日那个晚上非常不平凡,一件大事注定要被AI界写进里程碑。 一夜之间,全球开源界最强模型不再是Llama了,而是中国开源界的新星DeepSeek最新研发的前言模型V3,甚至可以比肩世界顶尖的闭源模型。 根据DeeSeek披露的基准测试分数,简单来讲,八个字:开源最强,闭源比肩。

大模型 DeepSeek:未授权任何人员参与机构投资者交流会,网传交流信息不实

据财联社报道,近期,一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek 专家”非公司人员,所交流信息不实。

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE,性能和 GPT-4o 不分伯仲

“深度求索”官方公众号昨日(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。