AI资讯列表 - AI在线

小技巧大功效，「仅阅读两次提示」让循环语言模型超越Transformer++

在当前 AI 领域，大语言模型采用的主流架构是 Transformer。不过，随着 RWKV、Mamba 等架构的陆续问世，出现了一个很明显的趋势：在语言建模困惑度方面与 Transformer 较量的循环大语言模型正在快速进入人们的视线。令人兴奋的是，这些架构在推理期间使用了恒定量的内存。不过，受制于有限的内存，循环语言模型（LM）无法记忆并使用长上下文中的所有信息，这导致了上下文学习（in-context learning，ICL）质量的不佳。因此，获得高效大语言模型的关键挑战在于选择存储或者丢弃哪些信息。在最

开发者利器！XREAL Air 2 ULTRA开售，沉浸式体验AI开发

北京时间7月31日下午2点整，XREAL系列AR眼镜的最新成员XREAL Air 2 Ultra在国内正式发售，目前在京东、天猫和抖音等平台都已上线，首发价3999元。这款AR眼镜是主要面向开发者群体打造的旗舰级产品，旨在降低广大开发者进入空间计算的门槛，推动空间计算领域革新，建立更繁荣的AR生态体系。赋能开发者六大核心能力作为XREAL第二款6 DoF（Six Degrees of Freedom，六自由度）全功能眼镜，XREAL Air 2 Ultra也是目前业界唯一通过双环境感知传感器（SLAM Camera

红外夜视、AI 识别，新设备可精准定位蚊子

以色列初创公司 Bzigo 推出了一款名为 Iris 的智能灭蚊设备，这款产品自 2020 年原型问世以来备受关注，如今终于正式上市，售价 339 美元（AI在线备注：当前约 2438 元人民币）。Iris 的工作原理十分智能，它通过广角摄像头和计算机视觉技术不间断扫描房间内的情况，即使在黑暗中，红外 LED 灯也能帮助它准确捕捉蚊子。Iris 的 AI 系统能够精准识别蚊子，不会误判为飞蛾或尘埃。一旦发现蚊子，Iris 会持续追踪其位置，直到蚊子停落。随后，设备会用 1 级人眼安全红色激光笔精确标出蚊子的落脚点，

Transformer作者回流谷歌，Character.AI创始团队被「收购」，只要人不要公司

AI 初创者的归宿还是大厂？一觉醒来，生成式 AI 的「吃鸡大赛」再次缩圈了。初创公司 Character.AI 周五宣布已与谷歌签署协议，谷歌将获得 Character.AI 的大型语言模型（LLM）技术的非独家许可。谷歌还宣布重新雇佣 Noam Shazeer 和 Daniel De Freitas。其中，Noam Shazeer 是 Character.AI 的创始人、CEO，也是 Transformer 论文作者之一，他曾在谷歌任首席软件工程师。而 Daniel De Freitas 是 Character

ICML 2024演讲爆火！Meta朱泽园揭秘大模型内心世界：不同于人类的2级推理

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]大语言模型 (LLM) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用

英特尔股价暴跌 26%，40 年来最大跌幅

财报披露一系列消息：业绩不及预期、裁员、暂停派发股息。北京时间今天凌晨，英特尔股价暴跌逾 26%，单日总市值蒸发达 323.7 亿美元（约合 2317 亿元人民币），经历了 40 年来表现最差的交易日之一。本周四，英特尔刚刚公布了低于预期的第二季度财报，报告显示收益低于华尔街预期，公司宣布暂停派息，同时计划实施更广泛的重组计划。在周五的交易日中，英特尔盘中跌幅曾一度接近 30%，据彭博社提供的数据，这是该股自 1982 年以来表现最差的一次。英特尔在财报中表示，在第二季度的营收为 128 亿美元，同比下降 1%，（

从现在起，GitHub上超1亿开发者可直接访问全球顶级大模型，构建AI应用

GitHub 推出的全新功能「GitHub Models」将有望加快 AI 工程师时代的到来。什么？大家熟悉的代码托管平台 GitHub 又进化了！该平台也开始提供 AI 大模型的 Playgroud 了。所有你能叫得上名字的业界流行大模型，包括微软的 Phi-3、OpenAI 的 GPT-4o、Meta 的 Llama 3.1、Cohere 的 Command R 、Mistral AI 的 Mistral Large，都可以在一个交互式沙盒中试用。在未来几个月，Github 也将添加更多语言、视觉以及其他类型的

首届大模型顶会COLM 高分论文：偏好搜索算法PairS，让大模型进行文本评估更高效

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]文章作者皆为来自剑桥大学语言技术实验室，一作为三年级博士生刘胤宏，导师为教授 Nigel Collier 和 Ehsan Shareghi。他的研究兴趣是大模型和文本评估，数据生成等。共同

特斯拉得州超级计算集群命名“Cortex”，拥有 10 万颗英伟达芯片

埃隆・马斯克 (Elon Musk) 周末在参观了最近建成的得克萨斯州超级计算集群后，透露了该工厂的名称。周六，马斯克在 X 上写道，得州超级工厂的超级计算集群被命名为“Cortex”，并指出他刚刚完成了新设施的演练。“Cortex”拥有约 10 万颗英伟达 H100 和 H200 芯片，用于训练全自动驾驶（FSD）和人形机器人擎天柱（Optimus）的神经网络。AI在线注意到，马斯克此前还详细介绍了 Cortex 超级计算集群的巨大冷却需求，并解释说该集群今年将需要约 130 MW 的电力，未来 18 个月内更是

日本创企“人机一体”研发人形机器人，可自动保持身体平衡

据共同社报道，日本机器人创新企业“人机一体”和立命馆大学 1 日公开展示其最新开发的人形机器人。该机器人由人类进行远程控制，可在事先未掌握周围环境的情况下自动保持身体平衡并安全运作。据介绍，该公司力争在 5 年内在高处等危险场地投入使用。AI在线汇总该机器人主要信息如下：参数方面，该机器人高约 2 米、宽约 70 厘米、重约 90 公斤。操作方面，该机器人由人类使用操纵杆控制手脚动作，通过机体的摄像头判断外界环境。上半身的动作由人控制，下半身会自动保持平衡，以便在人类不便控制的、脚下较难行走的地方运作。机器人足底装

AI 大语言模型价格战将启？谷歌本月下调 Gemini 1.5 Flash 费用：降幅最高 78.6%

大语言模型的价格战要来了吗？谷歌公司昨日（8 月 2 日）更新价格页面，宣布将于 2024 年 8 月 12 日开始，Gemini 1.5 Flash 模型每百万输入 tokens 成本为 0.075 美元、每百万输出 tokens 成本为 0.3 美元（AI在线备注：当前约 2.2 元人民币）。这让 Gemini 1.5 Flash 模型的使用成本，比 OpenAI 的 GPT-4o mini 便宜近 50%。根据计算，Gemini 1.5 Flash 模型费用输入费用比此前降低 78.6%，输出费用比此前降低

DeepMind 研究成本大起底，一篇 ICML 论文烧掉 1290 万美元

【新智元导读】DeepMind 最近被 ICML 2024 接收的一篇论文，完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本，大概是 Llama 3 预训练的 15%，耗费资金可达 12.9M 美元。发一篇顶会论文，需要多少实验预算？最近，DeepMind 发表了一项研究，对 LLM 扩大规模时各种算法和架构细节，比如参数和优化器的选择，进行了广泛的实证调查。这篇论文已被 ICML 2024 接收。论文地址：页的论文涵盖了数以万计的模型，备选方案包括 3 种优化器、4 种参数化方案、几

英国 AI 雄心受挫，13 亿英镑计算基础设施项目被搁置

根据 CNBC 报道，英国当局已搁置价值 13 亿英镑（AI在线备注：当前约 119.38 亿元人民币）的计算基础设施项目，意味着让英国成为世界人工智能领导者的雄心遭受重挫。政府发言人证实，为了优先考虑其它财政计划，政府将搁置两项由纳税人出资的重大支出承诺，价值分别为 5 亿英镑和 8 亿英镑。英国去年承诺提供 5 亿英镑，用于人工智能研究资源（AI Research Resource）；此外去年还宣布提供 8 亿英镑，为爱丁堡大学创建下一代超大规模计算机提供资金，该计算机每秒能够执行 1 万亿次计算。这些举措将提

谷歌勇攀 AI 新高峰，邀测最强 Gemini 1.5 Pro 模型：Arena 竞技场跑分超 GPT-4o

谷歌 AI Studio 产品总监 Logan Kilpatrick 昨日（8 月 2 日）在 X 平台发布推文，推出了实验版 Gemini 1.5 Pro AI 模型（0801），并邀请用户通过 AI Studio 和 Gemini API 测试和反馈。AI在线援引 Kilpatrick 后续推文，他表示在 LMSYS 的聊天机器人竞技场（Chatbot Arena）比赛中，无论是文本还是多模态，实验版 Gemini 1.5 Pro AI 模型（0801）均取得了第一名。实验版 Gemini 1.5 Pro AI

英伟达新 AI 芯片被曝因设计缺陷“跳票”至少 3 个月，微软、谷歌或受影响

感谢据《The Information》北京时间今天上午报道，帮助生产英伟达新 AI 芯片和服务器硬件的两位知情人士透露，由于存在“设计缺陷”，英伟达新型 AI 芯片的发布将被推迟三个月甚至更长时间。报道指出，这一缺陷可能会影响 Meta、谷歌、微软等一系列“大客户”，因为他们都已订购了价值数百亿美元的芯片。另外，还有一名微软员工和另一名知情人士透露，英伟达本周向微软和另一家大型云计算提供商发出通报，其新款 Blackwell 芯片中最先进的 AI 芯片将会“跳票”。据悉，微软是英伟达最大的客户之一。而据AI在线此

全球首例，AI “牙医”上岗：15 分钟搞定牙冠准备，耗时是人类牙医的 1/8

牙科行业迎来历史性时刻，AI 控制的自动机器人完成了全球首例牙科手术，且速度比人类牙医快大约八倍。该 AI 机器人由波士顿公司 Perceptive 制造，使用手持式三维容积扫描仪，通过光学相干断层扫描（OCT）建立详细的口腔三维模型，包括牙齿、牙龈甚至牙齿表面下的神经。OCT 只使用光束来建立体积模型，模型的分辨率很高，能自动检测出空腔，准确率约为 90%，且避免了有害的 X 射线辐射。该 AI 机器人完成的首例手术是牙冠准备牙齿：会进行局部麻醉，以帮助麻醉您的牙齿和周围的牙龈，以获得最佳的舒适度，然后修剪原来

贾扬清一吐为快：要想赚钱，AI模型到底该大该小？

最近的AI社区，关于模型规模的讨论有些活跃。一方面，此前在大模型开发奉为“圣经”的Scaling Law，似乎正在褪去光环。去年大家还在猜测GPT-5的规模“可能会大到想不到”，现在这种讨论几乎绝迹。

新王登基，Gemini 1.5 Pro再度更新，超越GPT 4o和Claude-3.5

8月2日，lmsys官方在推特发布一则消息，恭喜DeepMind研发的Gemini 1.5 Pro 实验版（0801）在Chatbot Arena排名登顶，超越GPT 4o和Claude-3.5夺得第一。这是继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来，OpenAI第二次让出Chatbot Arena的Overall ranking宝座。 Gemini 1.5 Pro 实验版（0801）在Chatbot Arena测试一周后。