AI资讯列表 - AI在线

美国参议员提跨党派提案：打击有害深度伪造，禁止篡改 AI 生成内容来源信息

来自共和民主两党的三位美国联邦参议院议员于当地时间 7 月 11 日宣布推出一项名为《保护内容来源和完整性，防止编辑和深度伪造媒体法案》的提案。AI在线注：这一法案英文全称为 Content Origin Protection and Integrity from Edited and Deepfaked Media Act，首字母简称为 COPIED ACT，后文以“COPIED 提案”代指。该提案旨在打击正在兴起的有害深度伪造，目标在美国联邦层面建立一个检测、标记与认证 AI 生成内容的透明度准则，保护记者、演

微软 CTO 坚信大型语言模型的“规模定律”依然奏效，未来可期

微软首席技术官（CTO）凯文・斯科特（Kevin Scott）上周在接受红杉资本旗下播客采访时，重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点，尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示：“其他人可能持不同观点，但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程，遗憾的是，你只能每隔几年才能看到一次，因为建造超级计算机然后用它们训练模型都需要时间。”202

微软 Recall 功能灵感来自 29 岁的比尔・盖茨的预言？早年节目录音流出

微软备受争议的 Windows Recall（回顾）功能是否出自 29 岁的比尔・盖茨的构想？近日，一档来自上世纪 80 年代中期广播节目的录音浮出水面，让人们不禁产生遐想。微软联合创始人盖茨当时只有 29 岁，他受邀参加了名为“知名电脑俱乐部”（The Famous Computer Cafe）的电台访谈节目。谈话中，盖茨阐述了他将个人电脑带入千家万户的愿景，以及赋予计算机学习能力的可能性。盖茨表示，随着用户的使用，计算机将能够学习并记住用户之前做过的操作，从而减少重复输入指令的麻烦。盖茨当时的设想与微软当前备受

谷歌 AI 概览多次产生错误内容后，现仅在 7% 的搜索中展示

Search Engine Land 报道称，5 月份 AI Overview（AI 概览）刚发布时，约有 80% 的搜索结果会出现 AI 概览，而现在 AI 概览仅在 7% 的搜索中展示。谷歌 5 月份在搜索中增加了 AI 概览功能，用户搜索问题时谷歌 AI 自动抓取网页内容生成总结，用户不需要点击每个搜索结果即可获得答案。据AI在线此前报道，有网友在谷歌搜索寻找“芝士和披萨粘不到一块”的解决办法时，谷歌 AI 提供的建议里却提到“你可以把 1/8 杯的无毒胶水加到酱料里，让其更黏”。随后谷歌发布相关声明，表示会

太酷了！iPhone、iPad、MacBook老旧设备组成异构集群，能跑Llama 3

假如你有闲置的设备，或许可以试一试。这次，你手里的硬件设备也能在 AI 领域大展拳脚了。将 iPhone、iPad、Macbook 进行组合，就能组装成「异构集群推理方案」，然后顺畅的运行 Llama3 模型。值得一提的是，这个异构集群可以是 Windows 系统，也可以是Linux、iOS 系统，并且对 Android 的支持很快到来。异构集群正在运行中。根据项目作者 @evilsocket 的介绍，

公理训练让LLM学会因果推理：6700万参数模型比肩万亿参数级GPT-4

把因果链展示给 LLM，它就能学会公理。AI 已经在帮助数学家和科学家做研究了，比如著名数学家陶哲轩就曾多次分享自己借助 GPT 等 AI 工具研究探索的经历。AI 要在这些领域大战拳脚，强大可靠的因果推理能力是必不可少的。本文要介绍的这项研究发现：在小图谱的因果传递性公理演示上训练的 Transformer 模型可以泛化用于大图谱的传递性公理。也就是说，如果让 Transformer 学会执行简单的因果推理，就可能将其用于更为复杂的因果推理。该团队提出的公理训练框架是一种基于被动数据来学习因果推理的新范式，只有演

谷歌机器人专家：机器人在现实中碰过的壁，AI也会碰

「机器学习一直生活在一个令机器人专家、化学家、生物学家和神经科学家羡慕不已的泡沫中，随着它真正开始发挥作用，我们所有人都将遇到其他人多年来一直在应对的同样的现实壁垒。」有人说，机器人领域进展缓慢，甚至和机器学习的其他子领域相比显得毫无进展。谷歌 DeepMind 机器人科学家，SayCan、RT-1、RT-2 等具身智能项目参与者 Alex Irpan 同意这一说法。但他认为，这是因为机器人学是一个和现实紧密连接的领域，现实的复杂性决定了他们不免碰壁。他还指出，这些问题不是机器人技术所独有的。同样的问题也适用于大语

抛弃视觉编码器，这个「原生版」多模态大模型也能媲美主流方法

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]一作刁海文，是大连理工大学博士生，导师是卢湖川教授。目前在北京智源人工智能研究院实习，指导老师是王鑫龙博士。他的研究兴趣是视觉与语言，大模型高效迁移，多模态大模型等。共同一作崔玉峰，毕业于

智能化软件开发2.0 | aiXcoder落地Agent技术，聚焦企业项目级代码生成场景

基于大模型的AI Agent，作为能够自主感知环境、形成记忆、规划行动、并调用各类工具执行复杂任务的新一代技术，正在重塑软件开发流程，引领智能化软件开发进入2.0阶段。北大aiXcoder团队早在2023年初就开始基于大模型的Agent在软件工程领域中的研究，先后发表了多篇相关论文【1,2,3,4】，是全球第一批研究通过大模型＋工具调用去解决项目级代码生成问题的团队，为Agent技术在软件开发领域应用奠定了坚实的理论基础。基于系列领先的研究成果，结合多年来为各行业落地个性化企业代码大模型的实践经验，aiXcoder

大模型集体“失智”：9.11 和 9.9 哪个大，几乎全翻车了

没眼看……“9.11 和 9.9 哪个大”这样简单的问题，居然把主流大模型都难倒了？？强如 GPT-4o，都坚定地认为 9.11 更大。谷歌 Gemini Advanced 付费版，同样的口径。新王 Claude 3.5 Sonnet，还一本正经的给出离谱的计算方法。9.11 = 9 1/10 1/1009.9 = 9 9/10到这一步还是对的，但下一步突然就不讲道理了如上所示，9.11 比 9.90 大 0.01。你想让我进一步详细解释小数的比较吗？这你还解释啥啊解释，简直要怀疑是全世界 AI 联合起

阿里领投首家人形机器人：逐际动力完成亿元 A 轮融资；谷歌 Eureka AI 模型提前曝光丨AI情报局

今日融资快报通用机器人公司逐际动力完成亿元A轮融资：逐际动力是一家通用机器人公司，专注于具身智能与足式机器人的研发和制造，产品包括人形双足、四轮足机器人及相关软硬件解决方案。创始人张巍是南方科技大学长聘教授，此前曾任美国俄亥俄州立大学电气与计算机工程系长聘教授。本轮融资由阿里巴巴、招商局创投、上汽集团旗下尚颀资本领投，原始股东峰瑞资本、绿洲资本和明势资本跟投。

微软为 Excel 等研发新 AI 模型：性能较常规方案提高 25.6%，词元使用成本降低 96%

根据微软最新公布的研究论文，计划为 Excel、谷歌 Sheets 等电子表格应用程序，开发全新的 AI 大语言模型--SpreadsheetLLM。研究人员表示现有电子表格应用程序具备丰富的功能，在布局和格式方面为用户提供大量的选项，因此传统 AI 大语言模型很难胜任电子表格处理场景。而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型，微软还研发了 SheetCompressor（压缩电子表格），让 SpreadsheetLLM 能够更好地理解、处理电子表格数据。AI在线援引论文摘要部分

效果超棒！9 款免费好用的老照片修复和上色 AI 神器

大家好，这里是和你们一起探索 AI 的花生~ 最近有关 “老照片动起来” AI 视频在互联网上爆火，制作教程优设网上就有，大家可以点击这里学习。今天则为大家推荐 9 款免费的老照片处理工具，它们都用了 AI 技术，能让我们轻松实现破损照片修复、模糊人脸高清化、黑白照片上色等效果，点开即用非常方便，这样 AI 视频的生成效果也会更好，下面一起来看看吧~ 相关推荐：一、AI 老照片修复网站直达：「AI 老照片修复」是 ModelScope 社区内的一个图片处理小工具，借助 AI 实现画质增强、智能上色等效果，

AI设计必看指南！简析谷歌+微软的AI设计原则

在这个 AI 触手可及的时代，智能技术已经悄无声息地融入了我们的日常生活。但你知道吗？每一个让人惊叹的 AI 产品背后，都有一套精妙的设计原则在支撑。谷歌和微软这样的科技巨头，他们不仅是技术的先锋，更是体验设计的领航者。他们在丰富的产品实践中提炼出这些 AI 设计原则。学习它们，可以让我们用更理性、更科学的方法进行设计，创造出更智能且更有温度的用户体验。下滑，让我们一起了解这些 AI 设计原则吧～一、谷歌AI设计指南《The People AI Guidebook》由 Google 的 PAIR 团队发布，

LG 新能源将使用 AI 为客户设计电池单元，一天就能搞定

韩国电池供应商 LG 新能源 (LG Energy Solution) 将采用人工智能 (AI) 技术为客户设计电池。得益于此，LG 新能源能够在一天之内设计出根据客户规格定制的电池单元。LG 新能源的 AI 电池设计系统基于该公司过去 30 年的数据，在 100,000 个设计案例中进行了训练。LG 新能源的一位代表表示，公司的人工智能电池设计系统可以确保客户快速且一致地获得高质量的电池设计方案，“这项技术的最大优势在于，无论设计人员的熟练程度如何，都能以一致的水平和速度完成电池设计。”据AI在线了解，电池设计通

YouTube 推出新规：用户可要求平台下架模仿自己面部、声音的 AI 合成内容

随着 AI 生成影音内容的普及，YouTube 也随之进行了一些政策调整。据 PhoneArena 当地时间 13 日报道，用户现可要求 YouTube 下架由 AI 生成的模仿自己面部、声音的视频。这一请求将根据 YouTube 的隐私请求流程提出，而不是像 deepfake 那样因为具有误导性而要求将其删除。YouTube 表示，申诉要求下架的主因是影片伤害当事人的“隐私权”，而且只有主要当事人才能要求删除，而不是因为深伪技术及误导性内容。图源 PixabayYouTube 方面称，平台将根据多种因素来决定是否

PyTorch 团队首发技术路线图，近百页文档披露 2024 下半年发展方向

最近，PyTorch 团队首次公布了开发路线图，由内部技术文档直接修改而来，披露了这个经典开源库下一步的发展方向。如果你在 AI 领域用 Python 开发，想必 PyTorch 一定是你的老朋友之一。2017 年，Meta AI 发布了这个机器学习和深度学习领域的开源库，如今已经走到了第 7 个年头。根据 Assembly AI 2021 年的统计数据，HuggingFace 上最受欢迎的 top 30 模型都能在 PyTorch 上运行，有 92% 的模型是 PyTorch 专有的，这个占比让包括 Tensor

商汤大模型的「5o」交互，普通人如何和 AI 过一天？

在商汤的演示下，日日新5o拥有像人一样的实时视觉能力，可以跟人进行流畅的视频交互——能听、能说、能看、无延时，它可以通过摄像头语音实现和用户的实时交互，并获知用户所在的真实场景下的各种状态信息，打破了与AI交互的次元壁，实现了与AI的“视频通话”，已经具备真人聊天般的交互体验。两个月前OpenAI推出了GPT-4o，以突破性的智能交互能力，彻底颠覆了我们对AI语音助手的认知，颠覆了过去的人机交互，给业界带来又一次震撼。震撼之外，中国大模型界对GPT-4o的认知似乎并不如GPT-4那么统一，有人认为「在实现AGI的路上，GPT-4o并不重要」、有人评价「在技术突破上，GPT-4o没那么惊艳」；有人认为GPT-4o的发布是 AI 2.0 时代的标志性事件，会催生全新的应用平台和商业模式。