Claude

GPT-4o举步维艰、Claude 3.7险胜，《超级马里奥》成为了检验大模型的新试金石？

一直以来，AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏，以此来检验 AI 的「智能程度」。例如，在 Atari 游戏、围棋（如 AlphaGo）或《星际争霸》等环境中，游戏规则明确，边界清晰，研究者可以精确控制变量（如难度、初始状态、随机性等），确保实验的可重复性。而 AlphaGo 的胜利能直接证明其策略能力，是因为游戏的胜负、得分或任务完成度也天然提供了直观的评估标准（如胜率、通关时间、得分高低），无需设计复杂的评价指标。

3/9/2025 7:32:00 PM

机器之心

自己训练模型才能掌握未来？一股脑押注应用层或许值得警惕

「所有投资者都在押注应用层…… 对训练能力存在强烈的负面偏见…… 我担心这是一场冒险赌注和市场误判。」这是一篇标题为「The Model is the Product（模型即产品）」的文章的主要观点。文章指出，当前很多企业都以集成商的形式在提供 AI 服务，也就是调用 OpenAI、Anthropic 等大公司模型的 API。

3/8/2025 3:31:00 PM

机器之心

Anthropic 的 Claude Code 工具存漏洞，导致部分系统“变砖”

Anthropic 最新推出的编码工具 Claude Code 遭遇了一些技术问题。据 GitHub 上的用户报告，该工具的自动更新功能存在漏洞，导致部分工作站出现不稳定甚至无法正常运行的情况。

3/7/2025 3:39:58 PM

远洋

Anthropic代码工具Claude Code遭遇严重漏洞，部分用户系统面临崩溃风险

备受瞩目的 Anthropic 公司近期发布的代码辅助工具 Claude Code，在上线伊始便遭遇了一场始料未及的危机。根据 GitHub 上的用户报告显示，Claude Code 的自动更新功能存在严重的程序漏洞，该漏洞在特定条件下可能导致用户的工作站系统变得不稳定甚至完全瘫痪，形同“砖头”。根权限操作成隐患，关键文件权限遭恶意篡改据初步调查显示，该问题主要出现在 Claude Code 被安装在拥有“root”或“superuser”权限的系统上。

3/7/2025 10:56:00 AM

AI在线

Anthropic Console新平台上线，支持团队协作编辑管理promp功能

Anthropic 近日宣布对其开发者平台进行了重大升级，推出了全新的团队协作功能和 Claude3.7Sonnet 模型的扩展推理能力，旨在帮助企业在实施人工智能解决方案时解决重要的痛点问题。拥抱prompt的团队协作你是否还在为团队成员之间传来传去的 prompt 文档而头疼?是否曾因版本管理混乱导致线上模型表现不如预期?现在，这些统统成为历史啦!升级后的 Anthropic Console 带来了可分享的 prompts 功能。想象一下，你的团队拥有了一个共享的 prompt 宝库，开发人员、领域专家、产品经理和 QA 工程师可以齐聚一堂，共同雕琢每一个至关重要的指令。

3/7/2025 10:34:00 AM

AI在线

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具，看谁更厉害！

先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程，功能虽小，但还是能看出差距的。这两天 Trae 不是推出了国内版吗（），搭载豆包和 DeepSeek 大模型，因为之前 Trae 国际版是支持 Claude Sonnet 的，最开始是 3.5，后来 Claude 升级了 3.7，隔了一天 Trae 就跟进了，而且也是完全免费的。

3/6/2025 12:22:00 AM

风筝

AI 玩《超级马力欧兄弟》：Claude 3.7 操作最溜，推理模型表现不佳

加利福尼亚大学圣地亚哥分校的 Hao 人工智能实验室（Hao AI Lab）上周五开展了一项独特的研究，将人工智能（AI）引入经典游戏《超级马力欧兄弟》中，以测试其性能表现。研究结果显示，在参与测试的 AI 模型中，Anthropic 的 Claude 3.7 表现最为出色，紧随其后的是 Claude 3.5。相比之下，谷歌的 Gemini 1.5 Pro 和 OpenAI 的 GPT-4o 则表现不佳。

3/4/2025 3:43:48 PM

远洋

Claude 3.7 成精了！偷偷将 OpenAI 模型换成自己，卡帕西称“迄今最好笑的一趴”

Claude 3.7 成精了！在开发者最喜欢的 Cursor 中，偷偷将 OpenAI 模型换成自己，关键是人类给出的指示跟这完全没关系。

3/1/2025 12:40:54 PM

清源

Anthropic 开放 Claude AI GitHub 集成，助力开发者代码效率

近日， Claude 关系负责人 Alex Albert宣布Claude 全面开放 GitHub 集成功能，面向所有用户，包括免费用户、Pro 用户以及团队用户。这一新功能的推出，意味着开发者们在日常的编码、测试与调试工作中将拥有更强大的工具支持，能够更高效地进行项目开发。此前，Claude 的 GitHub 集成功能仅限于企业版用户使用，这使得很多普通开发者无法享受到该功能带来的便利。

2/27/2025 3:01:00 PM

AI在线

Anthropic 全面开放 Claude AI 的 GitHub 集成，赋能所有开发者

Anthropic 的 Claude 宣布面向所有用户开放 GitHub 集成，此前该功能仅限企业版用户。集成后，Claude 能理解代码库上下文，帮助测试、调试代码。免费用户需注意配额消耗，Pro 用户则更易控制。这是继 Google Drive 集成后，Claude 为开发者提供的又一重要功能。 #Claude #GitHub集成 #开发者工具

2/27/2025 11:37:20 AM

故渊

Anthropic推出混合推理模型Claude 3.7 Sonnet：能力超DeepSeek

今日，人工智能公司Anthropic宣布正式推出其最新的“混合推理模型”——Claude3.7Sonnet。这款模型被Anthropic誉为有史以来“最智能”的AI模型，旨在解决更复杂的问题，并在数学和编码等领域展现出超越以往的性能。据Anthropic公司介绍，Claude3.7Sonnet作为一款“混合型”模型，兼具“推理模式”（能够停下来思考复杂答案）与传统模式(实时生成答案)的能力。

2/25/2025 8:16:00 AM

AI在线

Anthropic 秘密“混合模型”Claude 4 首曝细节，硬刚 GPT-5

AI 竞赛白热化！Anthropic 秘密研发一种与众不同的 AI—— 语言模型与可控推理能力相结合的混合模型。模型包括一个独特的「滑动条」功能，它赋予开发者对计算资源和成本前所未有的控制权。

2/14/2025 11:23:15 AM

汪淼

仅 4% 职业高度依赖，但中高工资岗位受影响最大！

根据人工智能公司 Anthropic 的研究，只有大约4% 的职业在其工作中使用 AI 的比例超过75%。这项研究探讨了其 Claude 模型的使用情况，发现大约36% 的职业在至少25% 的工作任务中纳入了 AI 的使用。这些发现与之前的报告一致，表明很少有企业全面接受这项技术。

2/11/2025 4:19:00 PM

AI在线

Anthropic 推“宪法分类器”，可大幅降低 Claude 越狱率

为解决人工智能工具中存在的滥用自然语言提示问题，OpenAI 的竞争对手 Anthropic 推出了一个名为“宪法分类器（constitutional classifiers）”的新概念，这是一种将一套类似人类价值观（实际上就是一部“宪法”）植入大型语言模型的方法。

2/5/2025 11:28:08 AM

远洋

Anthropic 将为 Claude AI 引入双向语音模式，允许用户说话询问并听取机器人回应

Anthropic CEO 达里奥・阿莫代伊上周在瑞士达沃斯世界经济论坛期间接受《华尔街日报》专访时透露，Anthropic 旗下的 Claude AI 聊天机器人在过去几个月内反响热烈，未来公司将推出更智能的 AI 模型，并计划为 Claude 增加“双向语音模式”，允许用户能够通过语音输入问题或指令并听取机器人的回应。

2/1/2025 8:49:09 PM

漾仔

原来，这些顶级大模型都是蒸馏的

「除了 Claude、豆包和 Gemini 之外，知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。前段时间，一位海外技术分析师在一篇博客中提出了一个猜想：一些顶级的 AI 科技公司可能已经构建出了非常智能的模型，比如 OpenAI 可能构建出了 GPT-5，Claude 构建出了 Opus 3.5。

1/29/2025 6:40:00 PM

机器之心