AI资讯列表 - AI在线

能给后院鸟儿起名，智能喂食器用 AI 技术识别鸟类个体

智能喂食器 Bird Buddy 近期宣布了名为“Nature Intelligence”的更新，为用户带来一系列新功能。升级后，Bird Buddy 不仅能识别光顾喂食器鸟儿的品种，还能通过人工智能图像识别技术，区分个体鸟类并为其起名，让观鸟更加有趣。Bird Buddy 公司将此功能称为“非侵入式鸟类标记”。传统鸟类标记需要在鸟腿上安装追踪器，而 Bird Buddy 则依靠其喂食器内置的 5MP 高清摄像头和 AI 图像识别技术，通过识别鸟儿的细节特征来区分不同的个体。该公司 CEO Franci Zidar

科技巨头被曝未经授权用 YouTube 内容训练 AI，苹果、英伟达在列

据 Wired 报道，包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意，就使用了他们视频的字幕文件来训练人工智能模型。AI在线注意到，此次事件影响到的创作者包括知名科技博主 MKBHD (Marques Brownlee)、MrBeast、PewDiePie、以及脱口秀主持人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔等。这些被用于训练 AI 的字幕文件相当于视频的文本转录内容。调查记者披露，一些世界上最富有的科技公司一直在利用来自成千上万个 YouTube 视频的素材来训练 AI，而这违反了 You

英国监管机构出手，正调查微软与 Inflection AI 相关交易

英国竞争和市场管理局（CMA）7 月 16 日发布声明称，正调查微软雇佣 Inflection AI 部分前员工以及与 Inflection 方面达成相关安排的情况。该监管机构担心此举可能导致“竞争实质性减少”。图源 PexelsCMA 在声明中表示，做出第一阶段决定的截止日期为 9 月 11 日，届时该机构将宣布是否将此案转入第二阶段的深入调查。今年 4 月，CMA 曾表示正在征集公众意见，针对一系列科技巨头与人工智能初创公司的交易展开调查，其中包括微软与 Inflection AI 的交易、微软与 Mistra

SOTA性能，厦大多模态蛋白质-配体亲和力预测AI方法，首次结合分子表面信息

编辑 | KX在药物研发领域，准确有效地预测蛋白质与配体的结合亲和力对于药物筛选和优化至关重要。然而，目前的研究没有考虑到分子表面信息在蛋白质-配体相互作用中的重要作用。基于此，来自厦门大学的研究人员提出了一种新颖的多模态特征提取（MFE）框架，该框架首次结合了蛋白质表面、3D 结构和序列的信息，并使用交叉注意机制进行不同模态之间的特征对齐。实验结果表明，该方法在预测蛋白质-配体结合亲和力方面取得了最先进的性能。此外，消融研究证明了该框架内蛋白质表面信息和多模态特征对齐的有效性和必要性。相关研究以「Surface-

人类模仿AI新赛道，AI：论疯癫，你是我爹

机器之能报道编辑：杨文AI被人类带坏！这个世界，太癫了……最近，社交媒体上冒出来一堆搞怪视频，打着 AI 的旗号，真人 cos AI，甚至抖音还专门出了个热门话题——人类模仿 AI 大赛。（视频来自抖音博主「关妮乱石」）视频链接：：左边一张旧照片，右边打着「AI 修复」的字幕，实际由真人演绎着脑干缺失的狗血「剧情」。-1-AI：第一次被人冒充，没想到比我还抽象自从可灵、Luma 发布以来，全球网友组团整活，什么特朗普和拜登打啵，鳌拜和韦小宝秀恩爱，奥特曼和黄仁勋打起来……只有你想不到，没有 AI「祸害」不到。（查看

美国参议员提跨党派提案：打击有害深度伪造，禁止篡改 AI 生成内容来源信息

来自共和民主两党的三位美国联邦参议院议员于当地时间 7 月 11 日宣布推出一项名为《保护内容来源和完整性，防止编辑和深度伪造媒体法案》的提案。AI在线注：这一法案英文全称为 Content Origin Protection and Integrity from Edited and Deepfaked Media Act，首字母简称为 COPIED ACT，后文以“COPIED 提案”代指。该提案旨在打击正在兴起的有害深度伪造，目标在美国联邦层面建立一个检测、标记与认证 AI 生成内容的透明度准则，保护记者、演

微软 CTO 坚信大型语言模型的“规模定律”依然奏效，未来可期

微软首席技术官（CTO）凯文・斯科特（Kevin Scott）上周在接受红杉资本旗下播客采访时，重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点，尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示：“其他人可能持不同观点，但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程，遗憾的是，你只能每隔几年才能看到一次，因为建造超级计算机然后用它们训练模型都需要时间。”202

微软 Recall 功能灵感来自 29 岁的比尔・盖茨的预言？早年节目录音流出

微软备受争议的 Windows Recall（回顾）功能是否出自 29 岁的比尔・盖茨的构想？近日，一档来自上世纪 80 年代中期广播节目的录音浮出水面，让人们不禁产生遐想。微软联合创始人盖茨当时只有 29 岁，他受邀参加了名为“知名电脑俱乐部”（The Famous Computer Cafe）的电台访谈节目。谈话中，盖茨阐述了他将个人电脑带入千家万户的愿景，以及赋予计算机学习能力的可能性。盖茨表示，随着用户的使用，计算机将能够学习并记住用户之前做过的操作，从而减少重复输入指令的麻烦。盖茨当时的设想与微软当前备受

谷歌 AI 概览多次产生错误内容后，现仅在 7% 的搜索中展示

Search Engine Land 报道称，5 月份 AI Overview（AI 概览）刚发布时，约有 80% 的搜索结果会出现 AI 概览，而现在 AI 概览仅在 7% 的搜索中展示。谷歌 5 月份在搜索中增加了 AI 概览功能，用户搜索问题时谷歌 AI 自动抓取网页内容生成总结，用户不需要点击每个搜索结果即可获得答案。据AI在线此前报道，有网友在谷歌搜索寻找“芝士和披萨粘不到一块”的解决办法时，谷歌 AI 提供的建议里却提到“你可以把 1/8 杯的无毒胶水加到酱料里，让其更黏”。随后谷歌发布相关声明，表示会

太酷了！iPhone、iPad、MacBook老旧设备组成异构集群，能跑Llama 3

假如你有闲置的设备，或许可以试一试。这次，你手里的硬件设备也能在 AI 领域大展拳脚了。将 iPhone、iPad、Macbook 进行组合，就能组装成「异构集群推理方案」，然后顺畅的运行 Llama3 模型。值得一提的是，这个异构集群可以是 Windows 系统，也可以是Linux、iOS 系统，并且对 Android 的支持很快到来。异构集群正在运行中。根据项目作者 @evilsocket 的介绍，

公理训练让LLM学会因果推理：6700万参数模型比肩万亿参数级GPT-4

把因果链展示给 LLM，它就能学会公理。AI 已经在帮助数学家和科学家做研究了，比如著名数学家陶哲轩就曾多次分享自己借助 GPT 等 AI 工具研究探索的经历。AI 要在这些领域大战拳脚，强大可靠的因果推理能力是必不可少的。本文要介绍的这项研究发现：在小图谱的因果传递性公理演示上训练的 Transformer 模型可以泛化用于大图谱的传递性公理。也就是说，如果让 Transformer 学会执行简单的因果推理，就可能将其用于更为复杂的因果推理。该团队提出的公理训练框架是一种基于被动数据来学习因果推理的新范式，只有演

谷歌机器人专家：机器人在现实中碰过的壁，AI也会碰

「机器学习一直生活在一个令机器人专家、化学家、生物学家和神经科学家羡慕不已的泡沫中，随着它真正开始发挥作用，我们所有人都将遇到其他人多年来一直在应对的同样的现实壁垒。」有人说，机器人领域进展缓慢，甚至和机器学习的其他子领域相比显得毫无进展。谷歌 DeepMind 机器人科学家，SayCan、RT-1、RT-2 等具身智能项目参与者 Alex Irpan 同意这一说法。但他认为，这是因为机器人学是一个和现实紧密连接的领域，现实的复杂性决定了他们不免碰壁。他还指出，这些问题不是机器人技术所独有的。同样的问题也适用于大语

抛弃视觉编码器，这个「原生版」多模态大模型也能媲美主流方法

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]一作刁海文，是大连理工大学博士生，导师是卢湖川教授。目前在北京智源人工智能研究院实习，指导老师是王鑫龙博士。他的研究兴趣是视觉与语言，大模型高效迁移，多模态大模型等。共同一作崔玉峰，毕业于

智能化软件开发2.0 | aiXcoder落地Agent技术，聚焦企业项目级代码生成场景

基于大模型的AI Agent，作为能够自主感知环境、形成记忆、规划行动、并调用各类工具执行复杂任务的新一代技术，正在重塑软件开发流程，引领智能化软件开发进入2.0阶段。北大aiXcoder团队早在2023年初就开始基于大模型的Agent在软件工程领域中的研究，先后发表了多篇相关论文【1,2,3,4】，是全球第一批研究通过大模型＋工具调用去解决项目级代码生成问题的团队，为Agent技术在软件开发领域应用奠定了坚实的理论基础。基于系列领先的研究成果，结合多年来为各行业落地个性化企业代码大模型的实践经验，aiXcoder

大模型集体“失智”：9.11 和 9.9 哪个大，几乎全翻车了

没眼看……“9.11 和 9.9 哪个大”这样简单的问题，居然把主流大模型都难倒了？？强如 GPT-4o，都坚定地认为 9.11 更大。谷歌 Gemini Advanced 付费版，同样的口径。新王 Claude 3.5 Sonnet，还一本正经的给出离谱的计算方法。9.11 = 9 1/10 1/1009.9 = 9 9/10到这一步还是对的，但下一步突然就不讲道理了如上所示，9.11 比 9.90 大 0.01。你想让我进一步详细解释小数的比较吗？这你还解释啥啊解释，简直要怀疑是全世界 AI 联合起

阿里领投首家人形机器人：逐际动力完成亿元 A 轮融资；谷歌 Eureka AI 模型提前曝光丨AI情报局

今日融资快报通用机器人公司逐际动力完成亿元A轮融资：逐际动力是一家通用机器人公司，专注于具身智能与足式机器人的研发和制造，产品包括人形双足、四轮足机器人及相关软硬件解决方案。创始人张巍是南方科技大学长聘教授，此前曾任美国俄亥俄州立大学电气与计算机工程系长聘教授。本轮融资由阿里巴巴、招商局创投、上汽集团旗下尚颀资本领投，原始股东峰瑞资本、绿洲资本和明势资本跟投。

微软为 Excel 等研发新 AI 模型：性能较常规方案提高 25.6%，词元使用成本降低 96%

根据微软最新公布的研究论文，计划为 Excel、谷歌 Sheets 等电子表格应用程序，开发全新的 AI 大语言模型--SpreadsheetLLM。研究人员表示现有电子表格应用程序具备丰富的功能，在布局和格式方面为用户提供大量的选项，因此传统 AI 大语言模型很难胜任电子表格处理场景。而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型，微软还研发了 SheetCompressor（压缩电子表格），让 SpreadsheetLLM 能够更好地理解、处理电子表格数据。AI在线援引论文摘要部分

效果超棒！9 款免费好用的老照片修复和上色 AI 神器

大家好，这里是和你们一起探索 AI 的花生~ 最近有关 “老照片动起来” AI 视频在互联网上爆火，制作教程优设网上就有，大家可以点击这里学习。今天则为大家推荐 9 款免费的老照片处理工具，它们都用了 AI 技术，能让我们轻松实现破损照片修复、模糊人脸高清化、黑白照片上色等效果，点开即用非常方便，这样 AI 视频的生成效果也会更好，下面一起来看看吧~ 相关推荐：一、AI 老照片修复网站直达：「AI 老照片修复」是 ModelScope 社区内的一个图片处理小工具，借助 AI 实现画质增强、智能上色等效果，