AI资讯列表 - AI在线

亚马逊 AI 版图新变数，15 年老将 Matt Wood 官宣离职

科技媒体 GeekWire 于 10 月 9 日发布博文，报道称 Amazon Web Services（AWS）副总裁马特・伍德（Matt Wood）即将离职，目前已在亚马逊工作 15 年。伍德于本周三在其领英（LinkedIn）账号上发布动态，宣布他将从亚马逊离职，亚马逊发言人随后向该媒体证实该消息，但没有透露继任者人选。伍德在领英动态中写道：“我很高兴能在我的下一个角色中继续为更多组织带来重新创造、转型和未来（更多内容敬请期待）”，暗示他即将公布新的岗位角色。

AI视频/图像如何精准控制人物表情？快试试这 4 款神器！

大家好我是花生~ 随着生成式 AI 技术的发展，无论是 AI 图片和视频质量都越来越好，可以轻松实现“以假乱真”。与此同时大家对细节把控的追求也在不断提升，如何让角色形象或场景保持一致、如何控制人物做出复杂连贯的动作、如何控制人物的面部表情等都是目前很受关注的问题。

不出所料！Jürgen又站出来反对Hinton得诺奖，Nature也炮轰提名过程不透明

今年的诺贝尔物理学奖颁给了两位享誉盛名的 AI 研究者 John J. Hopfield 和 Geoffrey E. Hinton，这确实让很多人感到意外。第一层疑问是：Hinton 和物理学有什么关系吗？第二层疑问是：AI 科学家是如何提名物理学奖的？这程序合理吗？连 GPT-4o 都不敢相信：当然，更深层的质疑来自一些同赛道的 AI 科学家，比如挑战 Hinton 多年的 LSTM 之父 ——Jürgen Schmidhuber。Jürgen Schmidhuber 又来了在统计物理学中，Hopfield 模型

开源软件Gradio上新5大功能，几行Python代码，构建Web应用程序

用最简单的方法来构建一个AI Web应用程序。Gradio 5 来了！刚刚，Gradio 官方表示经过几个月的努力，他们宣布 Gradio 5 稳定版本正式发布！快速入门：：是一个开源 Python 软件包，可让用户快速为机器学习模型、API 或任意 Python 函数构建 Demo 或 Web 应用程序。然后，用户可以使用 Gradio 的内置共享功能在几秒钟内通过公共链接分享 demo。无需 JavaScript、CSS 或 Web 托管经验！更重要的是，只需几行 Python 代码即可完成上述演示。这次开源

CMU副教授：在多智能体流行的当下，不要忽视单智能体系统

单智能体更简单、更易于维护。最近，「多智能体系统」是人工智能领域最热门的流行词之一，也是开源框架 MetaGPT 、 Autogen 等研究的焦点。但是，多智能体系统就一定是完美的吗近日，来自卡内基梅隆大学的副教授 Graham Neubig 在文章《Don't Sleep on Single-agent Systems》中强调了单智能体系统也不可忽视。Graham Neubig 从以下几个方面展开：当代 AI 智能体发展的元素，包括大语言模型、提示以及动作空间；多智能体系统示例；多智能体系统存在的问题；如何从使用

NeurIPS 2024｜SparseLLM：突破性全局剪枝技术，大语言模型稀疏化革命

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本篇工作已被NeurIPS（2024 Conference on Neural Information Processing Systems）会议接收，文章第一作者为美国埃默里大学的博士生

中国科学家运用人工智能算法发现大量全新 RNA 病毒，大幅拓宽 RNA 病毒库

AI在线从中山大学官方微信公众号获悉，10 月 9 日，中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》（Cell）杂志上发表论文，报告了 180 个超群、超过 16 万种全球 RNA 病毒的发现，这是迄今为止规模最大的 RNA 病毒研究，大幅扩展了全球 RNA 病毒的多样性，该研究将人工智能技术应用于病毒鉴定，发现了传统方法未能发现的病毒“暗物质”，探索了病毒学研究的新路径。据介绍，传统的病毒发现方法包括病毒分离和生命组学的生物信息学分析，高度依赖既有知识，面对 RNA 病毒这种高度分化、种类繁多且容易变异

vivo 宣布开放无障碍产品安卓公版，全栈 AI 能力免费用

在今日的 2024 vivo 开发者大会上，vivo 公布了在无障碍方面的最新进展。vivo「手语翻译官」升级了手语学习功能，用户可以用它自由学习手语，也同步协助了国家通用手语的普及与推广。此外，蓝心语音大模型将支持多种语言，让「vivo 听说 - 方言自由说」这个功能支持多种方言的识别和发声。vivo 还在多模态蓝心大模型的基础上，推出了「vivo 看见-蓝心升级版」。它能够更精准详细、更生动形象地描述镜头前的景象，并可以进行多轮问答的交流。此外，vivo 成为了中国残联的战略合作伙伴，面向 10 所高校的 10

ChatGPT 幕后大佬、o1 推理模型作者 Luke Metz 官宣从 OpenAI 离职

就在刚刚，又一位元老级人物官宣离职 OpenAI 了。o1 推理模型贡献者之一 Luke Metz 发文称，「我即将离开 OpenAI，结束这段超过两年的奇妙旅程」。与此同时，Information 爆料称，此前出走的后训练团队负责人 Barret Zoph，现有了新的继任者 ——William (Liam) Fedus。他也是 o1 模型的七大负责人之一。值得一提的是，今天的两位主角此前都曾是谷歌的研究员；在来到 OpenAI 之后，共同参与了 ChatGPT、GPT-4 和 o1 的研发。o1 七大 Leade

快多个数量级，清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊

编辑 | KX两年前，清华大学物理系徐勇、段文晖研究组开发出高效精确的第一性原理电子结构深度学习方法 DeePH，可极大加速电子结构计算。近日，该团队开发了一种准确而有效的实空间重构方法（real-space reconstruction），将 DeepH 方法从原先仅支持原子基组推广至适用于平面波基组，使得 DeepH 方法可与所有密度泛函理论（DFT）程序兼容。而且，该重构方法比传统的基于投影的方法快几个数量级。这给深度学习电子结构计算方法带来了更高的精度和更好的泛化能力，并打通了其利用电子结构大数据作深度学习

Nature子刊，基于量子实验数据进行机器学习，用于解决量子多体问题

编辑 | 萝卜皮量子硬件实现方面的进步使得人们能够获取传统计算机无法模拟的数据。将传统机器学习 (ML) 算法与这些数据相结合，有望揭示隐藏的模式。与仅使用传统计算机相比，这种混合方法扩展了可有效解决的问题类别，但由于当前量子计算机中噪声的普遍存在，这种方法仅能用于解决受限问题。韩国首尔大学（Seoul National University）的研究人员扩展了混合方法的适用性，用于解决多体物理学中的挑战，例如预测给定哈密顿量的基态性质以及对量子相进行分类。通过在具有 127 个量子比特的超导量子硬件上进行各种减少误

OpenAI GPT-4 解锁新成就：100% 识别性别、74.25% 识别年龄范围，未专门训练可媲美专业算法

科技媒体 The Decoder 昨日（10 月 9 日）发布博文，报道称最新研究表明 OpenAI 的 GPT-4 AI 模型在未经专门微调和训练情况下，能够识别面孔、判断性别，并在照片中估计年龄，其准确度媲美专业算法。来自挪威科技大学、Mizani 及 Idiap 研究所的研究人员推进这项研究，测试了 GPT-4 的生物识别能力，发现其性能和 MobileFaceNet 等专门的面部识别算法不相上下。在性别识别测试中，GPT-4 在 5400 张平衡（balanced）图像的数据集上取得了 100% 的准确率，

字节豆包推出AI智能体耳机Ola Friend，售价1199元

10 月 10 日，字节跳动豆包发布了首款 AI 智能体耳机 Ola Friend。这是一款开放式耳机，单耳6.6克同类最轻，实现了几乎无感的佩戴感受。该款耳机接入豆包大模型，并与豆包 APP 深度结合。用户戴上耳机后，无需打开手机，便能通过语音唤起豆包进行对话。在官方宣传片中，豆包特别强调了Ola Friend能够在信息查询、旅游出行、英语学习及情感交流等场景为用户提供帮助。豆包相关负责人表示：“这款耳机是豆包在AI场景的一个探索和尝试，希望Ola Friend能成为随时陪伴用户耳边的朋友。豆包的各种能力也会在后

vivo 全新蓝心大模型矩阵发布，推出 30 亿蓝心端侧大模型 3B、语音大模型

在今日上午的 2024 vivo 开发者大会开幕演讲中，vivo 正式发布了自研的全新蓝心大模型矩阵，全面升级语言大模型和端侧大模型能力，并带来 vivo 自研的语音大模型、图像大模型以及多模态大模型。据AI在线了解，全新蓝心大模型矩阵包括语言大模型、端侧大模型、语音大模型、图像大模型、多模态大模型。vivo 推出了全新的 30 亿蓝心端侧大模型 3B，官方称在对话写作、摘要总结、信息抽取等能力上，蓝心 3B 可以越级比肩行业 7B-9B 模型。相比蓝心 7B，蓝心 3B 极致性能提升 300%，平衡模式下功耗优化

vivo 手机智能体 PhoneGPT 亮相，可自动打电话订餐厅

感谢在今日上午的 2024 vivo 开发者大会上，vivo 公布了手机智能体 PhoneGPT。据介绍，PhoneGPT 支持自主拆解需求、主动规划路径、实时环境识别、动态反馈决策。vivo 展示了由 PhoneGPT 支持的小 V 订座助手功能，用户在与蓝心小 V 沟通订餐厅的细节信息后，小 V 可以直接自己打开 App 搜索餐厅，找到并拨打餐厅电话，与店员 AI 语音通话完成订座。AI在线从 2024 vivo 开发者大会获悉，PhoneGPT 未来也将实现端侧化。2024 vivo 开发者大会专题

vivo 蓝心智能 AI 战略发布：大模型与操作系统深度融合，向行业全面开放

在今日上午的 2024 vivo 开发者大会开幕演讲中，vivo 正式公布了蓝心智能 AI 战略。据介绍，vivo 将使用 AI 重构系统体验，包括：重构人与设备交互体验重构人与数字世界服务体验重构人与物理世界连接体验vivo 还公布了蓝心语音大模型的新进展，支持自然对话、同声传译、模拟人声、理解情绪。此外，蓝心小 V 智能助手支持四川话、苗语、粤语等方言语音对话。vivo 还在大模型端侧化方面有所布局，包括通话总结、文档概要、信息抽取、意图理解、本地知识图谱等方面均实现端侧化。此外 vivo 将推大模型端侧审核，

2024 科大讯飞全球 1024 开发者节官宣：首发多模态视觉交互、超拟人虚拟人交互能力

感谢AI在线从科大讯飞获悉，第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节将于今年 10 月 24 日在合肥奥体中心正式开启。官方表示，届时将发布讯飞星火大模型升级版，其底座能力将再次升级，包含数学、代码和长文本能力显著提升、中英文综合能力持续领先，训练推理效率大幅提升等特性。在今年的 1024 开发者节活动中，科大讯飞还将首次发布多模态视觉交互及超拟人虚拟人交互能力，官方称将面向万物智联“打造极致人机交互体验”。此外，还将在教育、医疗、科研、司法、政务等领域升级行业大模型及更多应用产品。在去年的

Demis Hassabis荣获诺贝尔化学奖，网友：诺奖需要AI

今年的诺奖被AI大佬包圆了。就在刚刚，瑞典皇家科学院已决定将 2024 年诺贝尔化学奖授予大卫·贝克（David Baker），“以表彰在计算蛋白质设计方面的贡献”；另一半则是共同授予德米斯·哈萨比斯（Demis Hassabis）和约翰·M·詹珀（John M. Jumper），“以表彰他们在蛋白质结构预测方面的成就”。