AI资讯列表 - AI在线

快多个数量级，清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊

编辑 | KX两年前，清华大学物理系徐勇、段文晖研究组开发出高效精确的第一性原理电子结构深度学习方法 DeePH，可极大加速电子结构计算。近日，该团队开发了一种准确而有效的实空间重构方法（real-space reconstruction），将 DeepH 方法从原先仅支持原子基组推广至适用于平面波基组，使得 DeepH 方法可与所有密度泛函理论（DFT）程序兼容。而且，该重构方法比传统的基于投影的方法快几个数量级。这给深度学习电子结构计算方法带来了更高的精度和更好的泛化能力，并打通了其利用电子结构大数据作深度学习

Nature子刊，基于量子实验数据进行机器学习，用于解决量子多体问题

编辑 | 萝卜皮量子硬件实现方面的进步使得人们能够获取传统计算机无法模拟的数据。将传统机器学习 (ML) 算法与这些数据相结合，有望揭示隐藏的模式。与仅使用传统计算机相比，这种混合方法扩展了可有效解决的问题类别，但由于当前量子计算机中噪声的普遍存在，这种方法仅能用于解决受限问题。韩国首尔大学（Seoul National University）的研究人员扩展了混合方法的适用性，用于解决多体物理学中的挑战，例如预测给定哈密顿量的基态性质以及对量子相进行分类。通过在具有 127 个量子比特的超导量子硬件上进行各种减少误

OpenAI GPT-4 解锁新成就：100% 识别性别、74.25% 识别年龄范围，未专门训练可媲美专业算法

科技媒体 The Decoder 昨日（10 月 9 日）发布博文，报道称最新研究表明 OpenAI 的 GPT-4 AI 模型在未经专门微调和训练情况下，能够识别面孔、判断性别，并在照片中估计年龄，其准确度媲美专业算法。来自挪威科技大学、Mizani 及 Idiap 研究所的研究人员推进这项研究，测试了 GPT-4 的生物识别能力，发现其性能和 MobileFaceNet 等专门的面部识别算法不相上下。在性别识别测试中，GPT-4 在 5400 张平衡（balanced）图像的数据集上取得了 100% 的准确率，

字节豆包推出AI智能体耳机Ola Friend，售价1199元

10 月 10 日，字节跳动豆包发布了首款 AI 智能体耳机 Ola Friend。这是一款开放式耳机，单耳6.6克同类最轻，实现了几乎无感的佩戴感受。该款耳机接入豆包大模型，并与豆包 APP 深度结合。用户戴上耳机后，无需打开手机，便能通过语音唤起豆包进行对话。在官方宣传片中，豆包特别强调了Ola Friend能够在信息查询、旅游出行、英语学习及情感交流等场景为用户提供帮助。豆包相关负责人表示：“这款耳机是豆包在AI场景的一个探索和尝试，希望Ola Friend能成为随时陪伴用户耳边的朋友。豆包的各种能力也会在后

vivo 全新蓝心大模型矩阵发布，推出 30 亿蓝心端侧大模型 3B、语音大模型

在今日上午的 2024 vivo 开发者大会开幕演讲中，vivo 正式发布了自研的全新蓝心大模型矩阵，全面升级语言大模型和端侧大模型能力，并带来 vivo 自研的语音大模型、图像大模型以及多模态大模型。据AI在线了解，全新蓝心大模型矩阵包括语言大模型、端侧大模型、语音大模型、图像大模型、多模态大模型。vivo 推出了全新的 30 亿蓝心端侧大模型 3B，官方称在对话写作、摘要总结、信息抽取等能力上，蓝心 3B 可以越级比肩行业 7B-9B 模型。相比蓝心 7B，蓝心 3B 极致性能提升 300%，平衡模式下功耗优化

vivo 手机智能体 PhoneGPT 亮相，可自动打电话订餐厅

感谢在今日上午的 2024 vivo 开发者大会上，vivo 公布了手机智能体 PhoneGPT。据介绍，PhoneGPT 支持自主拆解需求、主动规划路径、实时环境识别、动态反馈决策。vivo 展示了由 PhoneGPT 支持的小 V 订座助手功能，用户在与蓝心小 V 沟通订餐厅的细节信息后，小 V 可以直接自己打开 App 搜索餐厅，找到并拨打餐厅电话，与店员 AI 语音通话完成订座。AI在线从 2024 vivo 开发者大会获悉，PhoneGPT 未来也将实现端侧化。2024 vivo 开发者大会专题

vivo 蓝心智能 AI 战略发布：大模型与操作系统深度融合，向行业全面开放

在今日上午的 2024 vivo 开发者大会开幕演讲中，vivo 正式公布了蓝心智能 AI 战略。据介绍，vivo 将使用 AI 重构系统体验，包括：重构人与设备交互体验重构人与数字世界服务体验重构人与物理世界连接体验vivo 还公布了蓝心语音大模型的新进展，支持自然对话、同声传译、模拟人声、理解情绪。此外，蓝心小 V 智能助手支持四川话、苗语、粤语等方言语音对话。vivo 还在大模型端侧化方面有所布局，包括通话总结、文档概要、信息抽取、意图理解、本地知识图谱等方面均实现端侧化。此外 vivo 将推大模型端侧审核，

2024 科大讯飞全球 1024 开发者节官宣：首发多模态视觉交互、超拟人虚拟人交互能力

感谢AI在线从科大讯飞获悉，第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节将于今年 10 月 24 日在合肥奥体中心正式开启。官方表示，届时将发布讯飞星火大模型升级版，其底座能力将再次升级，包含数学、代码和长文本能力显著提升、中英文综合能力持续领先，训练推理效率大幅提升等特性。在今年的 1024 开发者节活动中，科大讯飞还将首次发布多模态视觉交互及超拟人虚拟人交互能力，官方称将面向万物智联“打造极致人机交互体验”。此外，还将在教育、医疗、科研、司法、政务等领域升级行业大模型及更多应用产品。在去年的

Demis Hassabis荣获诺贝尔化学奖，网友：诺奖需要AI

今年的诺奖被AI大佬包圆了。就在刚刚，瑞典皇家科学院已决定将 2024 年诺贝尔化学奖授予大卫·贝克（David Baker），“以表彰在计算蛋白质设计方面的贡献”；另一半则是共同授予德米斯·哈萨比斯（Demis Hassabis）和约翰·M·詹珀（John M. Jumper），“以表彰他们在蛋白质结构预测方面的成就”。

解读：物理诺贝尔奖为何颁给了HNN之父和深度学习之父？

就在刚刚，瑞典皇家科学院决定将 2024 年诺贝尔物理学奖授予约翰·J·霍普菲尔德 (John J. Hopfield) 和杰弗里·E·辛顿 (Geoffrey E. Hinton)，“表彰他们通过人工神经网络实现机器学习的基础性发现和发明”。

英伟达梦想，富士康模式：Alexander Wang如何用24万数字游民打造数据标注王国

这位世界上最年轻的白手起家的亿万富翁，曾在首次登上福布斯排行榜后迅速跌落，但几年后就重新夺回了这一头衔。给 Alexander Wang 带来这个极具传奇性的名号的，是他的数据工厂—— Scale AI。最近，Scale AI 实现了将近 10 亿美元的年化收入，同比增长了足足 4 倍。

首个开源 AI 候选版定义稿发布：四大要求，训练数据上有妥协

如何定义开源人工智能（AI）？开源倡议组织（OSI）经过 2 年的努力，于昨日（10 月 9 日）发布了首个开源 AI 定义候选版本。首个候选版本主要澄清开源 AI 领域的各种争议，规定一个 AI 系统 / 模型需要具备以下 4 种基础自由要求，才能视为开源，AI在线附上相关要求如下：在未获许可的情况下，他人可出于任何目的使用该系统。可以深入研究系统的运行原理出于任何目的修改系统。与他人共享，无论是否修改。OSI 在训练数据方面选择妥协，要求提供“关于用于训练系统的数据的足够详细信息”，而非完整数据集。此举旨在平衡

Meta 推出革命性 AI 视频工具，让广告创意焕然一新

感谢科技媒体 The Verge 于 10 月 8 日发布博文，报道称 Meta 公司在 Advertising Week 活动中，推出了 Image Animation 和 Video Expansion 两款 AI 工具。Image Animation根据 Meta 公司分享的最新动图，用户可以选择一张静态照片，无需在 Instagram Reels 上使用任何现有的视频素材，就能生成创意视频。早期广告客户的反馈积极，图像动画帮助他们克服了资源有限的问题，并为广告创意提供了更长的使用寿命。Video Expan

消息称 Kimi AI 助手内测深度推理功能，月之暗面有团队国庆加班 7 天 3 倍工资

据“大厂青年”公众号 10 月 8 日爆料，国产 AI 大模型 Kimi 的开发团队 —— 北京月之暗面科技有限公司有团队国庆加班七天，3 倍工资，一周就顶 1 个月。爆料称，月之暗面准备上线一个“很牛的功能”，跟深度思考有关。大概下一个版本里，会在搜索入口下方搞一个“深入推理”的开关，能回答简单搜索无法解决的问题，甚至可以自我反思，所以国庆期间一直疯狂赶进度。AI 独角兽公司月之暗面于 2023 年 3 月创立，于 2023 年 10 月推出全球首个支持输入 20 万汉字的智能助手产品 Kimi。创始团队核心成员

字节跳动发布 GR-2 机器人 AI 大模型：任务平均完成率 97.7%，模拟人类学习处理复杂任务

字节跳动研究团队最新推出了第二代机器人大模型 GR-2（Generative Robot2.0），其亮点在于创新构建“机器人婴儿期”学习阶段，模仿人类成长学习复杂任务，具备卓越的泛化能力和多任务通用性。 GR-2 模型和其它很多 AI 模型一样，包括预训练和微调两个过程。在预训练阶段，GR-2“观看”了多达 3800 万个来自各类公开数据集的互联网视频以及 500 亿个 tokens，涵盖了家庭、户外、办公室等多种日常场景，让 GR-2 具备在后续策略学习中跨越广泛机器人任务和环境的泛化能力。在微调阶段，团队使用机

AI 教父、诺贝尔奖得主辛顿：我为我的学生解雇 OpenAI CEO 感到骄傲

刚获得 2024 年度诺贝尔物理学奖、有“AI 教父”之称的加拿大多伦多大学教授杰弗里・辛顿（Geoffrey Hinton）在 10 月 9 日接受直播群访时表示，“我有很多非常聪明的学生，比我聪明得多，他们做了许多实事，事业伟大。我特别自豪的是，我的一个学生开除（fire）了萨姆・阿尔特曼。”辛顿提及，这名学生正是 OpenAI 的前首席科学家 Ilya Sutskever。Ilya Sutskever 是 OpenAI 的联合创始人，也是 2023 年底 OpenAI 高层“宫斗”大戏中的主角之一，而萨姆・阿

2024 最全合集！13个AI视频产品评测＆实战效果！

前言 - AI 视频闭源产品近半年发展 Sora 之后，DiT 架构成为视频生成产品的主流技术。这大半年里，横空出世的 Luma AI、Kling 成为视频生成领域最大黑马，而老牌选手 Runway 也推出了实力强劲的 Gen3 模型。AI 视频生成在画面表现力、语义理解、清晰度、可控性方面有了大幅提升，同时多家产品在音画同步、笔刷等工具上做了更新，提升了产品可控性。这篇文章会带大家了解 AI 视频产品的最新能力，不同产品的优势，以及展示各个产品的实测效果。这个系列预计分为闭源、开源两篇。以下是本文目录：一、先

OpenAI 预计 2029 年才能实现盈利，2026 年可能还要亏 140 亿美元

北京时间今天凌晨，据 The Information 报道，根据 OpenAI 公司的预测，直到 2029 年，公司才能实现盈利，届时公司收入将达到 1000 亿美元（AI在线备注：当前约 7063.46 亿元人民币）。根据 The Information 对 OpenAI 财务文件中数据的分析，在达到这一节点之前，到 2026 年的亏损可能会高达 140 亿美元（当前约 988.88 亿元人民币），几乎是今年预期亏损的三倍。这一估算尚不包含股票薪酬 —— 这是 OpenAI 最大的开支之一，但它并非以现金的形式支