AI资讯列表 - AI在线

美国多家汽车经销商将 AI 用于车辆初步检查：一分钟内可生成全面报告

当前 AI 几乎是“无处不在”，以汽车领域为例，有车载大模型语音助手，还有各种各样的智能辅助驾驶，不过 AI 的潜力还远不止于此。据 Carscoops 今日报道，美国多家经销商采用了 AI 系统用于车辆初步检查。▲ 图源 Carscoops报道称，相关技术已经在全美 300 家经销商展开部署，为它们显著提高了工作效率并缩短了工时。拉斯维加斯一家安装了自动化车辆检测系统的凯迪拉克经销商表示，整个扫描过程非常简单，只需不到一分钟。客户将车开过大型扫描仪，扫描仪便可以从各个角度（IT之家注：包括车底）拍摄多张照片。然后

2012 年以来 AI 领域首个，科大讯飞获 2023 年度国家科学技术进步奖一等奖

据“合肥发布”消息，2023 年度国家科学技术奖励大会今日在京召开，科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目，获得国家科学技术进步奖一等奖。这是 2012 年深度学习引发新一代人工智能浪潮以来，人工智能领域首个国家科学技术进步奖一等奖。据介绍，2023 年度国家科学技术奖共评选出 250 个项目。国家自然科学奖 49 项：一等奖 1 项，二等奖 48 项；国家技术发明奖 62 项：一等奖 8 项，二等奖 54 项；国家科技进步奖 139 项：特等奖 3 项，一等奖 16 项，二等奖 120

华为音乐与科大讯飞达成全面深度合作：音乐内容发行、手机铃音 AI 创作等

感谢在华为开发者大会 2024（HDC 2024）期间，华为音乐与科大讯飞股份有限公司在东莞举行全面深度合作签约仪式。双方将基于 HarmonyOS 发展面向全场景时代的新生态，在已有的音乐内容发行、艺人合作、手机铃音 AI 创作等方面展开更加深入的合作。华为互动媒体军团 CEO、华为终端云服务互动媒体 BU 总裁吴昊表示：“华为音乐与科大讯飞将持续紧密合作，基于 Audio Vivid 音频编解码标准共同创作更多空间音频作品。”科大讯飞股份有限公司 AI 文娱业务群副总裁，讯飞音乐主理人郭嘉表示：“科大讯飞作为一

消息称字节跳动与博通合作开发 AI 芯片：5nm 制程，台积电制造

感谢路透社报道，字节跳动正在与美国博通公司合作开发 AI 处理器，以确保有足够多的高端芯片。知情人士透露，这款 AI 处理器制程为 5nm，将由台积电制造。虽然设计工作进展顺利，但标志着设计阶段结束和制造开始的“流片”尚未开始。字节跳动和博通一直是业务合作伙伴，博通曾在声明中表示，字节跳动购买了其 Tomahawk 5nm 芯片以及其用于 AI 计算机集群的 Bailly 交换机。字节跳动与博通的合作将有助于大幅削减采购成本，并确保高端芯片的稳定供应。除抖音和 TikTok 外，字节跳动还运营一个类似 ChatGP

为什么都放弃了LangChain？

或许从诞生那天起，LangChain 就注定是一个口碑两极分化的产品。看好 LangChain 的人欣赏它丰富的工具和组建和易于集成等特点，不看好 LangChain 的人，认为它注定失败 —— 在这个技术变化如此之快的年代，用 LangChain 来构建一切根本行不通。夸张点的还有：「在我的咨询工作中，我花了 70% 的精力来说服人们不要使用 langchain 或 llamaindex。这解决了他们 90% 的问题。」最近，一篇 LangChain 吐槽文再次成为热议焦点：作者 Fabian Both 是 AI

从RLHF到DPO再到TDPO，大模型对齐算法已经是「token-level」

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]在人工智能领域的发展过程中，对大语言模型（LLM）的控制与指导始终是核心挑战之一，旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法（RLHF）来管理

CVPR 24｜ETH Zurich等团队：重新定义小样本3D分割任务，新基准开启广阔提升潜力！

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]该文章的第一作者安照崇，目前在哥本哈根大学攻读博士学位，导师为Serge Belongie。他硕士毕业于苏黎世联邦理工学院（ETH Zurich），在硕士期间，他在导师Luc Van Go

LeCun学生、纽大助理教授Alfredo视频上新，跟他免费学本科AI课程

喜欢学习基础人工智能知识的小伙伴们又有新的优质资源了！纽约大学计算机科学助理教授、图灵奖得主Yann LeCun的学生Alfredo Canziani开新课了！近日，Alfredo Canziani 在社媒 X 上宣布自己的春季「人工智能本科课程」放出在线视频了。一些章节的视频已经可以在Youtube上观看。视频观看地址：，这门《人工智能》课程包含两大部分。第一部分为基于知识的AI，由Ernest David教授授课。各章节讲授的知识点包括：基于知识的AI引言，搜索和约束满足问题、逻辑推理和自动推理、以及概率和简单

导师爆料：这篇CVPR最佳学生论文，从想法到成稿只用一个月，源自业余灵感

按部就班 vs. 好奇心驱动，哪个更容易出研究成果？ CVPR 2024 的最佳学生论文，竟然是用一个月的时间写出来的。北京时间 6 月 20 日凌晨，CVPR 2024 正式公布了最佳论文、最佳学生论文等奖项。其中，获得最佳论文的有两篇文章 ——BioCLIP 和 Mip-Splatting。据 Mip-Splatting 论文一作 Zehao Yu 的导师、图宾根大学教授 Andreas Geiger 透露，这篇论文从想法公布到成稿，只用了一个月的时间。而且，他还提到，Zehao Yu 之前参与过多个项目，并

墙裂推荐！Karpathy大模型培训课LLM101n上线了，非常基础

让我们训练一个 Storyteller。今天外网又被 Andrej Karpathy 这一良心课程刷屏了！项目是 11 小时前被 Karpathy 上传到 Github 的，目的是要构建一个能够创作、提炼和阐释小故事的大语言模型。如今已经被许多网友转发推荐。项目地址：，这是 karpathy 老师的新冒险。它将带您从语言建模、机器学习的基础知识开始学习，然后到多模态、RLHF、模型部署。也有网友称：看起来 karpathy 正在做一门完整的、类似 cs231n 的课程，《LLM101n》将讲授如何从头开始构建类似

华为盘古大模型5.0技术解密：更多模态，复杂推理

现在，AI 大模型可以真正与物理世界结合了。该大模型体系分为 10 亿级参数的 Pangu E 端侧模型，百亿级参数的 Pangu P，千亿级的 Pangu U，以及万亿级的 Pangu S 版本，在全系列、多模态、强思维三个方面实现了升级。盘古 5.0 可以与物理世界结合，理解包括文本、图片、视频、雷达、红外、遥感等多种模态的信息。它已在高铁故障检测等工业领域、具身智能等技术探索领域落地，因而受到了人们的关注。随着鸿蒙 HarmonyOS NEXT Beta 版本的发布，小艺也升级成为智能体，面向全场景设备提供语

字节豆包全新图像Tokenizer：生成图像最低只需32个token，最高提速410倍

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected] 在生成式模型的迅速发展中，Image Tokenization 扮演着一个很重要的角色，例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokeniz

阿里云通义灵码 AI 编程助手上线微软 Visual Studio 插件市场，个人专业版限时免费

通义灵码是阿里云出品的一款基于通义大模型的智能编码辅助工具，提供行级 / 函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力，支持 Java、Python、Go、C 等 200 多种编程语言。通义灵码 6 月 20 日宣布上线了微软 Visual Studio 插件市场，该工具此前已上线了 Visual Studio Code、JetBrains IDEs 等主流编程工具，全渠道下载量超 350 万。Visual Studio（VS）是微软推出的一款集

《Python 机器学习》作者新作：从头开始构建大型语言模型，代码已开源

自 ChatGPT 发布以来，大型语言模型（LLM）已经成为推动人工智能发展的关键技术。近期，机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》，旨在讲解从头开始构建大型语言模型的整个过程，包括如何创建、训练和调整大型语言模型。最近，Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。项目地址： LLM 来说，指令微调能够有效

StabilityAI获超1亿美元投资并任命新CEO；月之暗面称没有开发海外产品计划；GPT-5将在一年半后发布丨AI情报局

融资快报Stability AI 获超 1 亿美元投资并任命新的 CEO：The Information消息，Stability AI 已任命 Prem Akkaraju 为新任首席执行官。视觉特效公司维塔 Wētā FX 前首席执行官 Prem Akkaraju 是包括前 Facebook 总裁 Sean Parker 在内的投资者中的一员。报道称，这些投资者总共出资超过 1 亿美元，新的资金可能会缩减一些现有投资者的股份。

ICML 2024 | 特征污染：神经网络会学习不相关特征而泛化失败

论文标题：Feature Contamination: Neural Networks Learn Uncorrelated Features and Fail to Generalize论文链接：：，深度神经网络 SGD scaling的机器学习范式再次证明了其在AI领域的主导地位。为什么基于深度神经网络的范式能够取得成功？比较普遍的观点是：神经网络具有从海量的高维输入数据中自动学习抽象而可泛化的特征的能力。遗憾的是，受限于当前分析手段和数学工具的不足，目前我们对于“（深度）神经网络如何实现这样的特征学习过程”这

英伟达将在中东五国数据中心部署 AI 技术，首次在当地大规模推出产品

据路透社报道，卡塔尔电信集团 Ooredoo 首席执行官 Aziz Aluthman Fakhroo 当地时间 23 日在接受采访时表示，公司已经与英伟达签署协议，将在该公司于中东 5 个国家拥有的数据中心部署 AI 技术。此举意味着英伟达首次在中东地区大规模推出产品，Ooredoo 将成为该地区首家能够为其数据中心客户提供直接访问英伟达 AI 和图形处理技术权限的公司。此前，华盛顿曾限制向该地区出口美制尖端芯片。IT之家注：上文提到的 5 个中东国家包括卡塔尔、阿尔及利亚、突尼斯、阿曼、科威特。除此之外，Oore

研究发现，OpenAI 的 GPT-4o 道德推理能力胜过人类专家

近期的一项研究表明，OpenAI 最新的聊天机器人 GPT-4o 能够提供道德方面的解释和建议，且质量优于“公认的”道德专家所提供的建议。据 The Decoder 当地时间周六报道，美国北卡罗莱纳大学教堂山分校和艾伦 AI 研究所的研究人员进行了两项研究，将 GPT 模型与人类的道德推理能力进行比较，以探讨大语言模型是否可被视为“道德专家”。IT之家汇总研究内容如下：研究一501 名美国成年人对比了 GPT-3.5-turbo 模型和其他人类参与者的道德解释。结果表明，人们认为 GPT 的解释比人类参与者的解释更