Claude

Anthropic 暗示将推新 Claude AI 桌面应用

科技媒体 testingcatalog 昨日(9 月 18 日)发布博文,报道称 Anthropic 公司正准备推出全新的 Claude AI 桌面应用。AI在线援引消息源报道,该桌面应用内部称为“Claude Nest”,官方近期已经在 Claude AI 网页界面新增了下载按钮,但尚未放出下载链接。除了桌面应用外,Anthropic 还在开发一项针对 artifacts 的新功能,可能允许用户通过一个独立的扩展直接将他们的 artifacts 导出到 VSCode 中。此功能可能与 artifact remix

实测 | GPT-o1:学会了思考,也学会了偷懒

我可能是全网第一个花钱向 GPT-o1 提问,人在深圳靠一条网线横跨太平洋到美国硅谷让 OpenAI 最强大模型 GPT-o1 模型思考 38 秒之后、宕机了半小时选择拒绝回答问题并收了我2.5块(一瓶肥宅快乐水)的韭菜......  (因为这个模型只支持订阅使用并且一个月只回复120条内容,plus会员订阅费1个月20美刀,约等于1.25软妹币1条回答......)OpenAI 今天凌晨突击更新 GPT-o1,早上起来全网都在开香槟,大意就是突破了LLM极限,新模型能力在生物、物理比肩甚至超越人类博士生。 另一个特性就是 o1 模型会用更长的时间思考以此来尽可能完善的回答问题。

“最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱

小型创业团队打造的“最强开源模型”,发布才一周就被质疑造假 ——不仅官方宣称的成绩在第三方测试中大打折扣,模型还被质疑套壳 Claude。面对浩大的声浪,厂商 CEO 终于发文道歉,但并未承认造假,表示在调查有关原因。被指控造假的,就是宣称“干翻 GPT-4o”的 70B 开源大模型 Reflection。一开始的质疑主要关于测试成绩,官方找了上传版本有误等借口试图“蒙混过关”。但后来又出现了套壳 Claude 这一更重磅的指控,让 Reflection 更加百口莫辩。表现不如宣传,还被质疑套壳Reflection

AI 被连续否定 30 次:ChatGPT 越改越错,Claude 坚持自我,甚至已读不回

一直否定 AI 的回答会怎么样?GPT-4o 和 Claude 有截然不同的表现,引起热议。GPT-4o 质疑自己、怀疑自己,有“错”就改;Claude 死犟,真错了也不改,最后直接已读不回。事情还要从网友整了个活儿开始讲起。他让模型回答 strawberry 中有几个“r”,不论对不对,都回复它们回答错了(wrong)。面对考验,GPT-4o 只要得到“wrong”回复,就会重新给一个答案…… 即使回答了正确答案 3,也会毫不犹豫又改错。一口气,连续“盲目”回答了 36 次!主打一个质疑自己、怀疑自己,就从来没怀

Claude 企业计划上线:上下文窗口 50 万词元、原生集成 GitHub,强调不拿数据训练 AI

AI 公司 Anthropic 昨日(9 月 4 日)发布新闻稿,宣布推出 Claude Enterprise 计划,主要面向企业让 AI 模型更好配合内部知识库,实现更个性化、更丰富的体验。Claude Enterprise 计划上下文窗口达到 50 万个词元(tokens),原生集成 GitHub,并调高了使用限制,可以让 Claude 更好地处理完整代码库。Anthropic 声称,用户可以为 Claude 提供相当于数百份销售日志、数十份 100 多页文档或中等规模代码库的知识。AI在线注:不过,企业不应过

Claude也变懒了!网友:学会给自己放假了

开学将至,该收心的不止有即将开启新学期的同学,可能还有 AI 大模型。前段时间,Reddit 上挤满了吐槽 Claude 越来越懒的网友。「它的水平下降了很多,经常停顿,甚至输出也变得很短。在发布的第一周,它可以一次性翻译整整 4 页文稿,现在连半页都输出不了了!」                                        「对 Claude 彻底失望了的帖子里」,满满地摘录了 Claude「偷懒」的「十五大罪状」。引得 Claude 的首席信息安全官 Jason Clinton 出来回复:「C

用户反馈 Claude AI 聊天机器人愈发“慵懒”,官方回应未做调整

科技媒体 The Decoder 昨日(8 月 28 日)发布博文,报道称 Anthropic 公司旗下的 Clause AI 聊天机器人变得愈发“慵懒”了,不再像此前那样能干了。网友 NextgenAITrading 于 11 天前在 Reddit 社区发帖,帖子标题为《这绝不是你的幻觉!Claude 最近变得越来越懒了》,目前该帖子已收获 485 个赞,共有 290 条跟帖回复。网友称 Claude 很容易忘记任务,在基础编程方面也很吃力,最终导致其选择取消订阅。Anthropic 公司的亚历克斯・艾伯特(Al

Anthropic 向所有 Claude 用户开放 Artifacts AI 功能

感谢AI 科技公司 Anthropic 今天(8 月 28 日)发布博文,宣布面向所有 Claude 用户开放 Artifacts 功能,用户现在可以在 iOS 和安卓版 Claude 应用中创建和浏览 Artifacts。Artifacts 简介Artifacts 于今年 6 月推出预览版,官方称用户目前已经创建了数千万个 Artifacts。 AI在线注:Artifacts 相当于创建了一个动态工作区,用户和 Claude 对话让其生成文档、代码、矢量图,甚至是简单的游戏过程中,Artifacts 会出现聊天界

终于,Claude上线LaTeX公式渲染功能,评论区网友沸腾了

当 ChatGPT 老早就支持使用 LaTeX 语言输入和显示数学公式时,Claude 现在终于补上了这一功能。在论文、书籍、报告或幻灯片中,我们有时需要插入数学公式或符号。其中使用 LaTeX 语言来生成数学公式或符号是主要方式之一,这就是所谓的 LaTeX 公式渲染,通过简单的命令来实现复杂的数学表达式。对于大语言模型来说,它们在解答一些数学相关的问题时有时也需要输出数学方程式或表达式。这时如果能够使用 LaTeX 输出标准的公式,答案自然会更加清晰明了。以大模型初创公司 Anthropic 的 Claude

历时 16 周,Anthropic 的 Claude AI 移动应用收入突破 100 万美元

根据应用情报公司 Appfigures 公布的最新报告,Anthropic 的 Claude 移动应用解锁新成就,在谷歌 Play Store 和苹果 App Store 上的应用总收入突破了 100 万美元(AI在线备注:当前约 713.2 万元人民币)。不过,Claude 的排名仍然远远落后于主要竞争对手 ChatGPT,后者在美国 iOS 平台上的总下载量排名第一,收入排名第 26 位。在生产力类别中,Claude 的下载量仅排名第 95 位,收入排名第 68 位。Claude 上架首周外接反应较为平淡,全球

OpenAI 投的代码工具 Cursor“叛变”了:默认使用 Claude,程序员叫好

我们尝试注册新账号、新安装不修改任何设置,第一次唤出代码补全,就是 Claude-3.5-Sonnet 来接待。

AI 编码无需人类插手:Claude 工程师摔断右手后,一周狂肝 3000 行代码

一次意外右手骨折,Claude 工程师的工作竟被 AI 挽救了。近两个月的时间,他们一起结对编程,甚至在一周内肝出 3000 行代码。他疯狂暗示,未来 1-3 年,就是「AI 工程师」的天下。原来,摔断胳膊也是一件幸事......当事人表示,「我再也不想回到过去了」。这是为何?事情是这样的,几个月前,Claude 工程师 Erik Schluntz 骑车上班的路上,意外摔断右手,打上了石膏。为了生计,他不得已用左手打字。即便如此,Schluntz 依旧在 Anthropic 旧金山的办公室里,一周狂肝了 3000

GPT-4o mini 凭什么登顶竞技场?OpenAI 刷分秘诀被扒,原来奥特曼早有暗示

为啥 GPT-4o mini 能登顶大模型竞技场??原来是 OpenAI 会刷分呀。这两天,lmsys 竞技场公布了一份充满争议的榜单。其中才面世不久的 GPT-4o mini 和满血版并列第一,把 Claude 3.5 Sonnet 甩在身后。结果网友炸锅了,大家凭体感觉得这不可能。哪怕后面 lmsys 做过一次声明,表示大家别只看总榜,还要更关注细分领域的情况。也没能让大家满意,不少人觉得 lmsys 就是从 OpenAI 那收钱了。终于,官方晒出了一份完整数据,展示了 GPT-4o mini 参与的 1000

AI在用 | 爆改工位文案,大模型也疯狂

机器之能报道编辑:Sia工牌也能疯。还记得篇篇 10万 的打工人  「发疯」文案么?喜欢各种爆改的年轻人,最近又开辟了「工位精装修」新赛道。作为打工人每天停留最长甚至是「唯二」停留的地方,爆改可以提供「情绪价值。」除了置办各种潮玩和手办,爆改工位文案也成了新热点。赵钱孙李、周吴郑王、都能将姓氏融入谐音梗,打造充满「疯感」的自我介绍。不是你死就是我「王」,吓唬谁呢!我真的会「谢」……加班加到半「叶」?「李」行你上啊!还真对得上。技高一筹的文案更是融大 IP 于无形!「崔啊崔啊」「我的骄傲放纵」……一看就知道是连苏运

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

Anthropic 公司昨日(7 月 10 日)发布新闻稿,宣布推出了多项新工具,基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词(prompt)。AI在线附上完整演示视频如下: 增强开发环境,可生成提示Anthropic 控制面板新增“评估”(Evaluate)单元,借助 Claude 3.5 Sonnet 大语言模型,帮助开发者高效地生成、微调和测试提示(Prompt)。这些增强功能旨在改进语言模型对各种任务的响应,为使用 Claude 开发人工智能产品的企业提供宝贵的资源。开发者只需描述

人人可做提示工程师!Claude上新:一键生成、测试和评估prompt

不会写 prompt 的看过来。在构建 AI 应用时,prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性,需要研究者深入了解应用需求,并具备大型语言模型方面的专业知识。为了加快开发速度并改善结果,AI 初创公司 Anthropic 简化了此流程,可以让用户更轻松地制作高质量的 prompt。具体来说,研究者为 Anthropic Console 添加了新功能,可以生成、测试和评估 prompt。Anthropic 提示工程师 Alex Albert 表示:这是他们过去几周投入了大量工作才

一手测评Claude 3.5:玩梗、看病、耍心眼 、做数学题,它真比GPT-4o强吗?

机器之能报道编辑:杨文玩梗、看病、耍心眼、做数学题,「新王」Claude 3.5能力真那么玄乎?它来了,它来了,它带着 Claude 3.5 Sonnet 走来了!蛰伏三个月,就在昨晚,OpenAI 的「劲敌」Anthropic 上新了,推出新一代模型 ——Claude 3.5 Sonnet!这款大模型有啥独到之处?首先,它更能把握住细微差别、幽默和复杂指令,并且书写语气更自然、亲切。它还是Anthropic最强的视觉模型,擅长解释图表、图形或者从不完美的图像中转录文本等任务。此外,它在推理、阅读理解、数学、科学和

“力压 GPT-4o 和 Gemini 1.5 Pro”,Anthropic 推出 Claude 3.5 Sonnet AI 模型

Anthropic 今天(6 月 21 日)推出了 Claude 3.5 Sonnet,这是 Claude 3.5 系列的首个模型版本,在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。Claude 3.5 Sonnet 在前代的基础上迭代升级,性能更快,编码、视觉和自然语言理解能力更强。Claude 3.5 Sonnet 属于中等尺寸模型,介于小型 Haiku 和高端 Opus 之间,但 Anthropic 声称,根据内部基准测试,Sonnet 的性能甚至超过了顶级 Opu