AI资讯列表 - AI在线

大模型进入「实用」时代！腾讯助力「销冠」量产，5 分钟创建智能助手

今年年初，英伟达 CEO 黄仁勋因为劝人「别再学习计算机」被送上热搜。但其实，他的原话是「过去，几乎每个人都会告诉你，学习计算机至关重要，每个人都应该学会编程。但事实恰恰相反，我们的工作是创造计算技术，让大家都不需要编程，编程语言就是人类语言。」编程，是为了不再编程，这一愿景由来已久，而且在大模型出现之后逐渐成为可能。但在现阶段，直接把一个大模型丢给某个人或某个企业去用效果仍然不好。比如，你不能指望一个不会写 Prompt 的人利用大模型去构建一整个网站，也不能指望一个没有配置 AI 人才的公司把某个大模型变成公司

Karpathy称赞，从零实现LLaMa3项目爆火，半天1.5k star

项目中代码很多很全，值得细读。一个月前，Meta 发布了开源大模型 llama3 系列，在多个关键基准测试中优于业界 SOTA 模型，并在代码生成任务上全面领先。此后，开发者们便开始了本地部署和实现，比如 llama3 的中文实现、llama3 的纯 NumPy 实现等。十几个小时前，有位名为「Nishant Aklecha」的开发者发布了一个从零开始实现 llama3 的存储库，包括跨多个头的注意力矩阵乘法、位置编码和每个层在内都有非常详细的解释。该项目得到了大神 Karpathy 的称赞，他表示项目看起来不错，

首个GPU高级语言，大规模并行就像写Python，已获8500 Star

最多可支持 10000 个并发线程。经过近 10 年的不懈努力，对计算机科学核心的深入研究，人们终于实现了一个梦想：在 GPU 上运行高级语言。上周末，一种名为 Bend 的编程语言在开源社区引发了热烈的讨论，GitHub 的 Star 量已经超过了 8500。GitHub：，它仍处于研究阶段，但提出的思路已经让人们感到非常惊讶。使用 Bend，你可以为多核 CPU/GPU 编写并行代码，而无需成为具有 10 年经验的 C/CUDA 专家，感觉就像 Python 一样！

数据更多更好还是质量更高更好？这项研究能帮你做出选择

当计算预算低时，重复使用高质量数据更好；当不差钱时，使用大量数据更有利。对基础模型进行 scaling 是指使用更多数据、计算和参数进行预训练，简单来说就是「规模扩展」。虽然直接扩展模型规模看起来简单粗暴，但也确实为机器学习社区带来了不少表现卓越的模型。之前不少研究都认可扩大神经模型规模的做法，所谓量变引起质变，这种观点也被称为神经扩展律（neural scaling laws）。近段时间，又有不少人认为「数据」才是那些当前最佳的闭源模型的关键，不管是 LLM、VLM 还是扩散模型。随着数据质量的重要性得到认可，已

让大模型理解手机屏幕，苹果多模态Ferret-UI用自然语言操控手机

此次，苹果提出的多模态大语言模型（MLLM） Ferret-UI ，专门针对移动用户界面（UI）屏幕的理解进行了优化，其具备引用、定位和推理能力。移动应用已经成为我们日常生活的一大重要组成部分。使用移动应用时，我们通常是用眼睛看，用手执行对应操作。如果能将这个感知和交互过程自动化，用户也许能获得更加轻松的使用体验。此外，这还能助益手机辅助功能、多步 UI 导航、应用测试、可用性研究等。为了在用户界面内实现感知和交互的无缝自动化，就需要一个复杂的系统，其需要具备一系列关键能力。这样一个系统不仅要能完全理解屏幕内容，还

OpenAI CEO下场回应「封口协议」，争议还是到了股权利益上，奥特曼：我的锅

自从 Ilya 和超级对齐负责人 Jan 离职后，OpenAI 内部还是心散了，后续也有越来越多的人离职，同时也引发了更多的矛盾。昨天，争议的焦点来到了一份严格的「封口协议」。OpenAI 前员工 Kelsey Piper 爆料，任何员工的入职文件说明中都包含一项：「在离开公司的六十天内，你必须签署一份包含『一般豁免』的离职文件。如果你没有在 60 天内完成，你的股权获益将被取消。」这份引发风浪的文件截图，让 OpenAI CEO 迅速下场回应：「我们从未收回任何人的既得权益，如果人们不签署分离协议（或不同意不贬

在对齐 AI 时，为什么在线方法总是优于离线方法？

在线和离线对齐算法的性能差距根源何在？DeepMind实证剖析出炉在 AI 对齐问题上，在线方法似乎总是优于离线方法，但为什么会这样呢？近日，Google DeepMind 一篇论文试图通过基于假设验证的实证研究给出解答。论文标题：Understanding the performance gap between online and offline alignment algorithms论文地址：（RLHF）随着大型语言模型（LLM）发展而日渐成为一种用于 AI 对齐的常用框架。不过近段时间，直接偏好优化（DP

替代MLP的KAN，被开源项目扩展到卷积了

本月初，来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。KAN 在准确性和可解释性方面表现优于 MLP，而且它能以非常少的参数量胜过以更大参数量运行的 MLP。比如，作者表示，他们用 KAN 以更小的网络和更高的自动化程度重现了 DeepMind 的结果。具体来说，DeepMind 的 MLP 有大约 300000 个参数，而 KAN 只有大约 200 个参数。KAN 与 MLP 一样具有强大的数学基础，MLP 基于通用逼近定理，而 KAN 基于 Kolmogorov-Arnold

消息称苹果首席运营官威廉姆斯访问台积电，探讨 AI 芯片开发

台媒《经济日报》消息，苹果公司首席运营官杰夫・威廉姆斯（Jeff Williams）低调拜访台积电，台积电总裁魏哲家亲自接待。双方主要讨论了苹果自研 AI 芯片的开发，以及台积电使用先进制程技术生产芯片等事宜。苹果需要更多半导体先进技术支持，此前苹果已包下台积电 3 纳米首批产能，若后续预定 2 纳米乃至更先进制程的首批产能，台积电营收将继续增加，今年有机会创新高，预计可达 6000 亿元新台币（IT之家备注：当前约 1350 亿元人民币）。苹果首席财务官卢卡・梅斯特里（Luca Maestri）在财报会议上表示，

AI在用｜与书对话！微信读书上线「AI问书」，你问书答

机器之能报道编辑：Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。微信读书（App）给自己上了一个大分：「AI 问书」！阅读中有看不懂的地方？没关系，标记出来，AI 立马解释给你听。古人说，书中自有颜如玉，现在美人能和你对话了。打开微信读书，选本书试试。比如金宇澄的《繁花》，前言里就

用好这 3 款 3D 建模工具，让你的 AI 出图质量轻松提升200%

大家好，这里是和你们一起探索 AI 的花生~ 前段时间 Adobe 推出了一个新的在线 3D 建模工具 Project Neo，旨在通过便捷的 3D 元素搭建，来提升 2D 插画、特别是等距插画的创作效率。虽然新工具上线不过半个月，但是相关社区内已经涌现了很多优秀的设计作品。Projext Neo 制作的内容可以导出为 JPEG、SVG 和透明底 PNG 三种格式，方便用户导入 Adobe Ps 或 Ai 中进行进一步编辑处理。 Project Neo 网站直达：：Project Neo 的界面与 Ps 类似，因

大厂实战案例！如何做好电商AI数字人直播的体验设计？

电商 AI 数字人直播解决方案是什么？随着以 ChatGPT、文心一言为代表的大语言模型相继涌现，AI 电商也带来新的购物体验和新的经营模式。「电商 AI 数字人直播解决方案-慧播星」依托自研 StyleSync 技术/音频自恢复预训练技术/文心一言/自研 PicGen 技术等，实现 AI 复刻/定制优质主播、稳定 7*24 小时在线开播。低成本搭建多元直播场景，专家级商品讲解、实时互动问答、丰富的互动形态精准传达信息，既让消费者获得全新的购物体验，也赋能中小商家零门槛、零成本一键创建商品售卖直播间、助推 GM

Meta 首发「变色龙」挑战 GPT-4o，34B 参数引领多模态革命！10 万亿 token 训练刷新 SOTA

【新智元导读】GPT-4o 发布不到一周，首个敢于挑战王者的新模型诞生！最近，Meta 团队发布了「混合模态」Chameleon，可以在单一神经网络无缝处理文本和图像。10 万亿 token 训练的 34B 参数模型性能接近 GPT-4V，刷新 SOTA。GPT-4o 的横空出世，再次创立了一个多模态模型发展的新范式！为什么这么说？OpenAI 将其称为「首个『原生』多模态」模型，意味着 GPT-4o 与以往所有的模型，都不尽相同。传统的多模态基础模型，通常为每种模态采用特定的「编码器」或「解码器」，将不同的模态分

育碧 CEO：将使用 AI 技术开发更有活力、更丰富的游戏

育碧公司首席执行官 Yves Guillemot 近期在财报问答会中确认，公司计划将使用 AI 技术开发更有活力、更丰富的游戏。他表示，AI 可能会被用于公司部分工作的“自动化”。目前，育碧有两个小组正在研究生成式 AI—— 一个小组负责市场营销、销售、IT、法律等工作，另一组人马则专注于提高游戏质量、让游戏更有“生命力”的工作。“我对我们游戏中的生成式 AI 充满期待，希望它能让我们的游戏更加有趣，人们能够真正获得个性化的体验。”育碧也在其最新财报中强调，公司将继续投资生成式 AI 等新技术领域，因为这些技术可为

自己声音被拿来训练 AI，美国两位配音演员对初创公司 Lovo 提起诉讼

感谢据《纽约时报》报道，美国两名配音演员 Paul Skye Lehrman 和 Linnea Sage 近日声称，AI 初创公司 Lovo 在未经自己许可的情况下，“复制”了他们的声音，并对该公司提起诉讼。事情的起因，是去年夏季两人在驾车时听到一个播客节目，其内容是“AI 的兴起”，并谈到了 AI 对作家、演员和其他娱乐界从业者的生活将构成威胁。而在这期节目中，主持人“采访”了一个名叫 Poe 的聊天机器人，他的音色听上去就像 Paul 的原声。图源 PixabayPaul 表示，当时的情景就像主持人在采访“自己

日本东京地方法院驳回 AI“发明”专利申请：发明人仅限于人类

感谢据 NHK 报道，当地时间周五，日本东京地方法院就 AI“发明”的设备是否能获得专利一事作出裁决 —— 以“发明人必须是人类”为由，裁定不为其授予专利。据报道，居住在美国的原告为人工智能自主发明的设备申请专利，发明人的名字却是“自主发明本产品的人工智能 DABUS”。早在三年前，专利局就已经驳回了该申请，当时就已经明确表示“发明人必须是人类”。原告不服并提起诉讼，要求撤销该决定。图源 Pexels东京地方法院审判长中岛基至在近期的判决中指出，《知识产权基本法》对发明的定义是“人类活动创造的产物”。即使放眼全球，

月之暗面 Kimi 智能助手加入“给 Kimi 加油”付费选项：可获得高峰期优先使用权益

感谢月之暗面 Kimi 智能助手现已上线“给 Kimi 加油”付费选项，可获得高峰期优先使用权益。目前只有电脑网页端可以支付支持，提供以下六种档位：送 Kimi 一朵花：5.2 元 / 4 天，折合 1.3 元 / 天给 Kimi 加鸡腿：9.99 元 / 8 天，折合约 1.25 元 / 天请 Kimi 喝咖啡：28.8 元 / 23 天，折合约 1.25 元 / 天给 Kimi 充充电：49.9 元 / 40 天，折合约 1.25 元 / 天请 Kimi 吃顿饭：99.0 元 / 93 天，折合约 1.06 元

为确保训练数据公开透明，英国政府将加快制定人工智能相关规则

据《金融时报》报道，近日，英国政府文化大臣露西・弗雷泽宣布将加快制定有关人工智能透明度的规则，以帮助保护内容创作者。她表示，这些规则的出台将意味着 AI 公司必须更加公开、透明地披露训练模型所用的数据情况，用户也可以自己选择哪些数据可被 AI 公司用来训练，作品被用于训练模型的创作者也将获得报酬。图源 Pexels不仅仅是英国，欧盟当前也正在根据其人工智能法案制定类似的规则。根据该法案，AI 开发者将需要提供一份足够详细的培训内容概要，并实施相关政策，以确保自身操作符合欧盟版权法的规定。作为回应的一部分，OpenA