AI资讯列表 - AI在线

“最强开源 AI 模型”，4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布

感谢科技媒体 The Information 本周五发布博文，援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B，在现有 80 亿和 700 亿参数两个版本之外，推出 4050 亿参数版本，号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时，扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型，但当时没有透露太多的信息。AI在线注：上图为机翻字幕，存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型，

亚马逊推出 AI 购物助手 Rufus，可回答客户各种问题

亚马逊宣布其生成式 AI 购物助手 Rufus 经过五个月的小范围测试之后现已面向所有美国客户开放。亚马逊表示，Rufus 旨在帮助您节省时间并做出更明智的购物决策。它可以回答您各种各样的购物需求和商品问题，“就像随身带了一个购物助手一样”。用户可通过点击亚马逊 App 中的一个图标调出文本聊天界面，从而向 Rufus 提出各种问题，例如识别耐用的户外扬声器型号、比较跑鞋或获取订单更新。AI在线注意到，Rufus 接受过亚马逊目录和网络内容训练，因此它还熟悉名人生平，可以建议用户到缅因州哪些湖泊游玩，甚至还可以写一

马斯克：到 2026 年，Neuralink 将为超过 1000 名患者植入脑机芯片

亿万富翁马斯克创立的脑机接口公司 Neuralink 对未来有着雄心勃勃的计划。11 日傍晚，马斯克在自家的 X（推特）平台发文宣布，目标是到 2026 年，为超过 1000 名患者植入脑机芯片，这是可行的。据悉，第一位植入 Neuralink 脑机芯片的人类患者 Noland Arbaugh 曾公开表示，这项技术改变了自己的生活。据AI在线此前报道，Noland Arbaugh 颈部以下曾处于瘫痪状态，在接受手术前，无法“很好地”与技术进行交互，无法使用 iPad 和口含式点击设备快速打字。而在手术后，他能够轻松

欧盟《人工智能法案》8 月 1 日生效，学校 / 工作场所不得使用实时情绪识别系统

当地时间 12 日，欧盟在其官方公报发布了《人工智能法案（Artificial Intelligence Act，下称 AI 法案）》的最终完整版本。这项新法将在发布后 20 天生效，也就是当地时间 8 月 1 日。据 TechCrunch 报道，该法案中的所有条款将在两年内全面适用，但其中一些将会更早实施。AI在线汇总主要内容如下：AI 法案生效 6 个月后：对部分 AI 应用程序的禁令将生效。如收集和汇编用于数据库的人脸识别信息、在学校和工作场所使用实时情绪识别系统等。AI 法案生效 9 个月后：对 AI 开发

德国法院允许对 AI 发明授予专利：人类需被列为发明人

感谢根据 DevClass 当地时间 10 日的报道，德国的一家法院上周裁定，只要人类被列为发明人，AI 生成的发明就可以获得专利。这一案件是由“人工发明者项目”推动的。该项目发起了一系列公益法律测试案件，寻求在没有传统人类发明者或作者的情况下，为 AI 生成的成果获得知识产权。该项目的目标是激发关于 AI 及类似技术影响的讨论，并就 AI 成果的“可保护性”提供指导。具体来看，德国最高民事法院联邦法院裁定，由名为 DABUS 的 AI 系统制作的午餐盒设计可以申请专利。人类申请人 —— 即拥有 DABUS 的科学

全球首个发短信就能用的 AI 大模型，中国电信推出“星辰慧答”服务

中国电信今日宣布推出“星辰慧答”服务，将 AI 智能赋予传统短信业务，这也是全球首个通过短信通道提供的大模型服务。据介绍，星辰大模型由中电信人工智能公司和中国电信人工智能研究院（TeleAI）联合研发，覆盖语义、语音、视觉、多模态等。TeleAI 最近又联合中国电信增值业务运营中心，推出了“星辰慧答”服务。区别于传统大模型需要额外下载 App 或者使用网页、小程序等的要求，星辰慧答简单原生，中国电信用户仅需编辑短信至 106599333 即可开启 AI 交互。AI在线注：星辰慧答给用户的回复不收取任何费用，用户主动

机器人大模型新公司！数据规模比同行大1000倍！贝索斯、孙正义等押注

机器之能报道编辑：Sia用 OpenAI 的方式颠覆机器人世界。「GPT-3 时刻正在进入机器人世界。」最近，Sequoia 合伙人 Stephanie Zhan 在投资了一家新机器人初创后说道。无论是在物流、车厂试点的人形机器人，还是四足机器狗，都要有脑子。过去，脑子要定制，「专款专用」，现在，不必了。最近，位于匹兹堡的机器人初创 Skild AI 声称，已经开发出一种通用的智能系统。它就像一个通用的智能模块，可以接入不同机器人，让他们立刻获得一些基本能力，如爬坡、跨过障碍、识别和捡起物品。7 月 9 日，Sk

字节跳动筋斗云人才计划开启

五年后的今天，训练GPT-2只需不到700刀、24小时，Karpathy又整新活

论老黄卖铲子的技术含量。2019 年 2 月，OpenAI 发布了 GPT-2，因为在文本生成上的优异表现，以及对于预训练 Transformer 架构的充分运用，被认为是如今大预言模型的「始祖」。五年后的今天，训练 GPT-2 这样 15 亿参数的大模型，只需要花费 672 美元，在一个 8XH100 的 GPU 节点上跑 24 个小时就可以搞定了。本周四，前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 在他纯 C 语言复现 GPT-2 大模型的项目「llm.c」的最新

英伟达又赚到了！FlashAttention3来了：H100利用率飙升至75%

740 TFLOPS！迄今最强 FlashAttention 来了。随着大型语言模型（LLM）加速落地，扩展模型上下文窗口变得越来越重要。然而，Transformer 架构的核心 —— 注意力层的时间复杂度和空间复杂度与输入序列长度的平方成正比。这使得扩展模型上下文窗口存在挑战。2022 年，一种快速、内存高效的注意力算法 ——FlashAttention 问世，该算法无需任何近似即可加速注意力并减少内存占用。FlashAttention 对注意力计算进行重新排序的算法，并利用 tiling 和重计算来显著加快计算

ICML 2024 | 梯度检查点太慢？不降速、省显存，LowMemoryBP大幅提升反向传播显存效率

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文论文一作是南开大学统计与数据科学学院研二硕士生杨雨辰，指导老师为南开大学统计与数据科学学院的徐君副教授。徐君老师团队的研究重点是计算机视觉、生成式 AI 和高效机器学习，并在顶级会议和

DeepMind开发用于量子化学计算的神经网络变分蒙特卡罗

编辑 | X近百年前，狄拉克提出正电子概念，如今在医学物理、天体物理及材料科学等多个领域都具有技术相关性。然而，正电子-分子复合物基态性质的量子化学计算具有挑战性。在此，DeepMind 和伦敦帝国理工学院的研究人员，使用最近开发的费米子神经网络 (FermiNet) 波函数来解决这个问题，该波函数不依赖于基组。研究发现 FermiNet 可以在一系列具有各种不同定性正电子结合特性的原子和小分子中产生高度精确的、在某些情况下是最先进的基态能量。研究人员计算了具有挑战性的非极性苯分子的结合能，发现与实验值高度一致，并

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者来自于新加坡国立大学、南洋理工大学以及哈工深。其中，费豪的研究方向为多模态学习、多模态大语言模型。吴胜琼，新加坡国立大学博士生，主要研究方向为多模态大语言模型。吉炜的主要研究方向为

清华类脑计算模型登Nature子刊，受大脑启发的人工树突网络，实现高能效AI

编辑 | KX5 月 30 日，清华大学类脑计算研究中心施路平团队，研发出全球首款类脑互补视觉芯片「天眸芯」，研究成果登上 Nature 封面。近日，该团队推出一种新的神经形态计算架构，即类脑神经计算模型「Dendristor」。「Dendristor」旨在复制突触的组织（即神经元之间的连接）和树突的树状结构（即从神经元体延伸出来的突起）。这种创新的树突网络模拟了树突状结构及其固有的时空处理特性，为未来人工智能提供了高能效的视觉感知能力。类脑形态树突网络计算模型的开发由清华大学跨学科团队清华大学脑与智能实验室（T

智谱 AI 开源视频理解模型 CogVLM2-Video，可回答时间相关问题

感谢智谱 AI 宣布，训练了一种新的视频理解模型 CogVLM2-Video，并将其开源。据介绍，当前大多数的视频理解模型使用帧平均和视频标记压缩方法，导致时间信息的丢失，无法准确回答与时间相关的问题。一些专注于时间问答数据集的模型过于局限于特定格式和适用领域，使得模型失去了更广泛的问答能力。▲ 官方效果演示智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法，生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据，引入了多帧视频图像和时间戳作为编码器输入，训练出 CogVLM2

多模态遥感大模型的探索与实践，蚂蚁集团遥感大模型负责人王剑带来深度解读

7月5日，在世界人工智能大会组委会办公室、上海市徐汇区人民政府指导下，由上海人工智能实验室、AI在线、全球高校人工智能学术联盟主办的 2024 WAIC 云帆奖暨人工智能青年论坛成功举办。论坛汇聚来自斯坦福大学、牛津大学、UCLA、加州大学、苏黎世联邦理工学院、香港大学、清华大学、北京大学、上海交通大学等海内外高校、研究机构及企业的30余位往届及新晋云帆奖得主线下参会，凝聚国际青年AI科学家的智慧，积极探索AI能力边界，为中国AI发展蓝图贡献新生力量。蚂蚁集团遥感大模型负责人王剑作作为2024 WAIC 云帆奖代表

OpenAI 提出通用人工智能五级标准，自认为接近但未达到第二级

彭博社报道称，OpenAI 提出通用人工智能五级标准，用来确认人工智能的进展。OpenAI 高管告诉员工，公司自认为目前还处于第一级，但即将达到第二级。通用人工智能（AGI、Artificial General Intelligence），是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体，具备自主的感知、认知、决策、学习、执行和社会协作等能力，且符合人类情感、伦理与道德观念。AI在线附 OpenAI 提出的等级标准：第一级：聊天机器人，具有会话语言的人工智能第二级：推理者，

Groq获贝莱德3亿美元投资，最新估值22亿美元；Hayden AI获9000万美元C轮融资丨AI情报局

融资快报Groq 获贝莱德 3 亿美元投资，最新估值 22 亿美元Groq 创始人Jonathan Ross，毕业于纽约大学，曾在谷歌 X 实验室参与多个项目，包括 Tensor Processing Unit谷歌定制机器学习芯片的开发，该芯片曾运用在与李世石的 AlphaGo 比赛。离开谷歌后他成立了Groq，并开发出了 LPU AI 处理器，在推理速度上比英伟达的 GPU 快 10 倍，成本更低，仅为十分之一。 LPU 展示了以每秒超过 100 个词组的速度执行大型语言模型的能力，但由于内存容量较小，实际部署成本可能远高于预期。