AI资讯列表 - AI在线

专家警告：AI 能耗巨大，加剧气候危机

人工智能专家 Sasha Luccioni 警告称，生成式人工智能使用的能源是传统搜索引擎的 30 倍，正在加速气候危机。图源 PexelsLuccioni 致力于提高人们对热门新技术对环境影响的认识。她于 2024 年被美国《时代》杂志评选为世界人工智能领域 100 位最具影响力人物之一，多年来一直致力于量化 ChatGPT 或 Midjourney 等程序的排放量。在蒙特利尔举办的 ALL IN 人工智能会议上，Luccioni 接受法新社采访时表示，生成式人工智能需要大量计算能力进行训练，这需要强大的服务器。

天津大学为新生研发“AI 学长”海棠棠：24 小时解答学术科研、校园生活、个人发展等问题

天津大学未来技术学院打造了“迎新神器” —— 新生智能体“海棠棠”，能够 24 小时解答新生在学术科研、校园生活、个人发展等方面的各类常见问题。AI在线注意到，以往新生们通常只能通过翻阅厚重的校园手册、查询论坛和公众号等散落的碎片化讯息，或是向学长、学姐、辅导员们询问才能得到答案。但面对一个个“在线等”的问题，学长、老师们很难一一及时解答。“海棠棠”以文心大模型为基座模型，汇集百余个官方媒体平台的信息。作为“AI 学长”，海棠棠为新生“抓取”全网信息，解决学习、生活各方面的问题，帮助新生更加了解学校，适应大学生活。

英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型：专为角色扮演设计，9216 MLP、上下文长度 4096 词元

科技媒体 marktechpost 昨日（9 月 14 日）发布博文，报道称英伟达开源了 Nemotron-Mini-4B-Instruct AI 模型，标志着该公司在 AI 领域创新又一新篇章。小语言模型的大潜力Nemotron-Mini-4B-Instruct AI 模型专为角色扮演、检索增强生成（RAG）及函数调用等任务设计，是一个小语言模型（SLM），通过蒸馏（distilled）和优化更大的 Nemotron-4 15B 获得。英伟达使用剪枝（pruning）、量化（quantization）和蒸馏（di

消息称 OpenAI 明年调整结构，转变为传统的营利性公司

《财富》（fortune）于 9 月 13 日发布博文，报道称山姆・阿尔特曼（Sam Altman）在最近周会上，向 OpenAI 公司员工宣布，将于明年调整颇为复杂的非营利性企业结构。报道称 OpenAI 在保留一个非营利部门之外，调整成为更传统的营利性公司。阿尔特曼表示 OpenAI 将摆脱非营利实体控制，转型为一家更为传统的营利性组织，但在周会上并未透露更多细节。AI在线援引消息源报道，OpenAI 一位发言人透露公司仍“致力于构建造福所有人的 AI”，并强调非营利性是“其使命的核心，并将持续存在”。Open

华为诺亚联合中科大发布工具调用模型ToolACE，效果持平GPT-4获开源第一

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

「LLM」这个名字不好，Karpathy认为不准确、马斯克怒批太愚蠢

在 AI 领域，几乎每个人都在谈论大型语言模型，其英文全称为 Large Language Models，简写为 LLM。因为 LLM 中有「Language」一词，因此，大家默认这种技术和语言密切相关。然而，知名 AI 大牛 Andrej Karpathy 却对此有着独特的见解：「大型语言模型（LLM）名字虽然带有语言二字，但它们其实与语言关系不大，这只是历史问题，更确切的名字应该是自回归 Transformer 或者其他。LLM 更多是一种统计建模的通用技术，它们主要通过自回归 Transformer 来模拟

DeepMind又损大将，AI总监Nando de Freitas离职，曾领导开发Gato、Genie

这边 OpenAI 刚发了又一个引爆 AI 圈的大模型 o1，那边谷歌 DeepMind 高级 AI 总监 Nando de Freitas 宣布了自己离职的消息。9 月 13 日，Nando de Freitas 发推表示自己要离开工作 10 年之久的谷歌 DeepMind 了。「过去无疑是人工智能历史上最激动人心的几年，自己的成长已经超出了预期，感谢我的那些聪明、慷慨且乐于助人的同事们。」他接着写到，DeepMind 一直是人工智能创新领域的中心，很多著名的研究人员从这里离开并创立了 OpenAI、Mistr

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

微软发布 Windows Agent Arena 基准框架，评估 AI Agents 运行主流 Windows 应用性能

科技媒体 NeoWin 昨日（9 月 14 日）发布博文，报道称微软官方推出了 Windows Agent Arena 基准框架，用于评估生成式 AI Agents 在 Windows PC 上的性能。Windows Agent Arena 基准框架微软表示该基准框架 AI Agents 使用主流 Windows 应用方面的能力和速度，其中包括 Microsoft Edge 和谷歌 Chrome 浏览器，Visual Studio Code 等编程应用，记事本、时钟和画图等预装 Windows 应用，VLC 等主流

大厂AI设计实战！飞猪如何用AI打造100种不可思议的旅行？

以下视频来源于飞猪设计当视频在手机上无法加载，可前往PC查看。这 100 种全球不可思议的旅行玩法，是否有一个吸引了你，现在就想出发呢？在这个人人都能营销的时代，传统的大市场、大高空、大观点的中心化营销方式正在逐步走向小团体、私空间、个性化的转变。曾经，一句响亮的 Slogan、一幅吸睛的大 KV、一段创意十足的 TVC 或许就能让消费者目不转睛，甚至占领心智。而如今，面对这类营销，对于消费者个体来说内心只会充满问号，who care？和我有什么关系？如果不能共情，那就请不要打扰我。因为消费者早已不是信息的被动

OpenAI o1 非 GPT-4o 直接进化，在成本与性能上妥协

9 月 14 日消息，OpenAI 已经推出了新模型 OpenAI o1 的两大变体 ——o1-preview 与 o1-mini，这两款模型都有许多值得深入探讨的内容。人工智能专家西蒙・威利森（Simon Willison）专门发文，深入剖析了这些新模型背后的设计理念与实现细节，揭示了它们在技术上的独特优势与不足。威利森表示，o1 并不是简单的 GPT-4o 直接升级版，而是在强化“推理”能力的同时，做出了成本与性能上的权衡。1. 训练思维链OpenAI 的声明是一个很好的起点：“我们研发了一系列新型人工智能模型

米哈游 AI 大模型“Glossa”完成备案

感谢上海市互联网信息办公室 9 月 9 日发布“上海市生成式人工智能服务已备案信息公告”，新增 7 款已完成备案的生成式人工智能服务，累计已完成 41 款生成式人工智能服务备案。从最新备案的生成式人工智能服务名单可以看到，米哈游旗下子公司“上海米哈游秘法科技有限公司”的服务通过备案，模型名称为“Glossa”。米哈游创始人蔡浩宇曾放话“AIGC（人工智能生成内容）将彻底改变游戏开发行业”，他认为未来在游戏开发领域将只有两类人，顶尖的天才（团队）和业余爱好者，对于其他普通到专业级的开发者，蔡浩宇则建议“可以考虑转行了

AI 江湖“饭局”：马斯克、埃里森晚宴上向黄仁勋求购英伟达 GPU

甲骨文创始人拉里・埃里森在公司最新财报电话会议上透露了一段轶事，他表示，自己曾与特斯拉 CEO 埃隆・马斯克一起，亲自向英伟达 CEO 黄仁勋求购最新的 AI GPU。在位于帕洛阿尔托的 Nobu 餐厅，埃里森和马斯克向黄仁勋恳求向他们供应英伟达的最新 GPU，“我们向他乞求，请卖给我们，不，多卖给我们，越多越好，我们都需要，拜托了。”埃里森回忆道，“最后事情进展顺利，起作用了。”这次晚餐显然非常成功，埃里森和甲骨文得到了他们想要的 GPU。该公司最近宣布将打造一个名为 Zettascale AI 的超算集群，由

国内金融领域虚假人脸检测标准“零的突破”，《虚假数字人脸检测金融应用技术规范》发布

感谢据 21 财经今天傍晚报道，为提升金融信息系统的安全性，9 月 6 日北京国家金融科技认证中心联合 10 多家金融机构发布的《虚假数字人脸检测金融应用技术规范》（AI在线注：下称《应用规范》）正式施行。《应用规范》规定了面向金融领域应用的虚假数字人脸检测服务的技术框架、功能要求、性能要求等，并提出对应的测试评估方法，专门针对通过生成式 AI、Deepfake（深度伪造）等技术制作的虚假人脸内容进行检测。其为金融机构防御虚假数字人脸攻击提供了重要参考，这是国内首个面向 Deepfake 进行安全检测的标准。《应用

阿里通义将发布 AI 视频生成大模型，支持文生视频、图生视频

感谢阿里通义将在 2024 云栖大会（9 月 19 日至 9 月 21 日）期间发布视频生成大模型，目前通义 App 频道和通义万相 PC 端已上线“视频生成”入口，仅支持用户预约，但未开放使用。页面内容显示，全新发布的视频生成大模型是由通义实验室自主研发，包含“文生视频”和“图生视频”两种创作模式。AI在线测试，预约成功后，阿里通义会在用户获得使用资格时进行通知，并赠送给用户 66 灵感值（有效期 30 天）。

消息称国内 AI 大模型初创公司 MiniMax 产品负责人张前川离职

感谢据《智能涌现》报道，中国 AI 大模型初创公司 MiniMax 产品负责人、前今日头条用户产品负责人张前川，因个人原因目前已淡出公司事务，改任产品顾问一职。MiniMax 回应称，消息内容属实，感谢前川的付出和努力。一名知情者表示，产品顾问其实是虚职，张前川已经不参与公司业务，与离职无异。报道称，张前川此前在 MiniMax 内负责“星野”和“海螺”两款公司主力产品。2024 年中，张前川又淡出“星野”的决策，参与 MiniMax 生产力工具“海螺 AI”和部分其他产品的日常事务。张前川离职后，MiniMax

加速蛋白质工程，微软开发蛋白突变效应预测AI框架µFormer

编辑 | KX蛋白质工程是合成生物学领域的重要研究方向之一。近年来，AI 辅助的蛋白质工程逐渐发展成为一种高效的蛋白质分子设计新策略。近日，微软研究院科学智能中心的研究人员提出了深度学习框架 µFormer，其将预训练的蛋白质语言模型与定制设计的评分模块相结合，从而预测蛋白质的突变效应。µFormer 在预测高阶突变体、建模上位（epistatic）相互作用和处理插入方面，实现了最先进的性能。通过将 µFormer 与强化学习框架相结合，可以高效探索广阔的突变空间，涵盖数万亿个突变候选物，来设计活性增强的蛋白质变体

张俊林：OpenAI o1的价值意义及强化学习的Scaling Law

蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。一、OpenAI o1 是大模型的巨大进步我觉得 OpenAI o1 是自 GPT 4 发布以来，基座大模型最大的进展，逻辑推理能力提升的效果和方法比预想的要好，GPT 4o 和 o1 是发展大模型不同的方向，但是 o1 这个方向更根本，重要性也比 GPT 4o 这种方向要重要得多，原因下面会分析。为什么说 o1 比 4o 方向重要？这是两种不同的大模型发展思路，说实话在看到 GPT 4o 发布的时候我是有些失望的，我当时以为 Op