应用 - AI在线

AI 大神 Karpathy 官宣创业：打造 80 亿人 AI 原生学校，首款课程 GitHub 斩获 17k 星

今天，AI 圈再次掀起海啸级巨震，离职 OpenAI 近半年的 AI 大牛 Karpathy 终于官宣了最终动向。他激动地宣布，自己正在创办一家 AI 教育的公司 —— Eureka Labs。Karpathy 这条官宣帖子，已有近百万浏览。Eureka Labs 官推初次现身，写下了「你好世界」。不难想到，自 2 月离职以来，Karpathy 一直都在专注在线授课领域，并不断动手尝试自己的新项目。当时，网友们便对 Karpathy 能够坚持输出高质教育内容的呼声越来越高。如今，愿望成真了！▲ 唯一的不足就是

消息称字节将于 7 月 19 日首次大范围公布文生图 / 视频等 AI 模型进展

钛媒体 AGI 报道称，字节跳动团队将会在 7 月 19 日（本周五）首次大范围公布文生图、类 sora 新视频等全新人工智能（AI）模型技术进展，尤其在长视频、高动态方向上具备创新技术，或将直接对标 Sora 效果。消息人士表示，字节跳动内部将 AI 大模型设为集团 P0 最高级别的方向。此外抖音、剪映等内部多个团队也在研发 AI 视频模型应用，预计将在近期公布。字节跳动将在新加坡举办关于世界模型（World Models）探索的 AI 技术菁英论坛（ByteDance AI Luminary Talks）活动，

戴盟机器人王煜：「具身技能」才能发挥人形机器人的作用 | 具身智能十人谈

作者：赖文昕编辑：岑峰本月，在爆火的世界人工智能大会（WAIC 2024）中，人形机器人「十八金刚」成为了会场中当之无愧的焦点。由青龙、智元-远征A2、宇树-H1、傅利叶-GR-1、星动纪元-XBot-L、乐聚-夸父4代等一众人形机器人组成的先锋阵列，作为「镇馆之宝」被陈列在展览馆进门处，成为了所有进场观众看到的首个惊喜。在大模型技术的加持下，长出「大脑」的人形机器人被视为通向 AGI 的必经之路，「具身智能元年」似乎已经到来。

AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资；微软为 Excel 等研发新 AI 模型丨AI情报局

今日融资快报AI编程Anysphere获得A16z新一轮投资，估值达4亿美元AI 编程初创公司 Anysphere 发布AI代码编辑器 Cursor，并成功从知名风险投资公司 A16z 获得新一轮融资，估值至少达到4亿美元。 Cursor 被多个大型科技公司使用，包括 OpenAI 和 Perplexity。 Anysphere 的目标是通过AI 编辑器帮助开发者提高工作效率，简化编码过程。

苹果、英伟达等公司被曝使用争议 YouTube 资源训练 AI 模型：5.7GB，涉及 4.8 万个频道 17.4 万个视频字幕

非营利性新闻工作室 ProofNews 昨日（7 月 16 日）发布博文，表示包括苹果、英伟达、Salesforce 和 Anthrophic 在内的大型科技公司，在训练其 AI 模型时均使用了来自 YouTube 的视频资源。报道称这些科技公司在训练其 AI 模型过程中，使用了名为 YouTube Subtitles 的数据集，大小为 5.7GB（4.89 亿个单词）。该数据集由 EleutherAI 创建，最早发布于 2020 年，涉及超过 48000 个频道的 173536 个 YouTube 视频字幕内容

第三波！2024年7月精选实用设计工具合集

大家好，这是 2024 年 7 月的第 3 波干货合集！这一期干货合集包含有好几个资源合集类型的素材，有基于 Notion 整合的资源和 AI 工具合集，有免费的矢量 LOGO 素材网站，有超全面的海外版设计资源导航，也有专业的图标和插画素材网站。此外，这次合集中还有基于 AI 的配色工具，可以直接导入 Figma 的那种，还有基于 AI 的手绘转数字版图表的工具，相当专业。当然，在此之前记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货： 1、基于 Notion 的设计资源和 AI 工具合集

ComfyUI 进阶篇！完整梳理 ComfyUI 的核心节点（二）

前言：学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后，会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类，可能会让人感到不知所措。在这篇文章中，我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理，并详细解释每个参数。希望大家在学习过程中培养自我思考的能力，真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结，才能在面对复杂的工作流时游刃有余。祝大家学习顺利，早日成为 ComfyUI 的高手！一、VAE Decode

能给后院鸟儿起名，智能喂食器用 AI 技术识别鸟类个体

智能喂食器 Bird Buddy 近期宣布了名为“Nature Intelligence”的更新，为用户带来一系列新功能。升级后，Bird Buddy 不仅能识别光顾喂食器鸟儿的品种，还能通过人工智能图像识别技术，区分个体鸟类并为其起名，让观鸟更加有趣。Bird Buddy 公司将此功能称为“非侵入式鸟类标记”。传统鸟类标记需要在鸟腿上安装追踪器，而 Bird Buddy 则依靠其喂食器内置的 5MP 高清摄像头和 AI 图像识别技术，通过识别鸟儿的细节特征来区分不同的个体。该公司 CEO Franci Zidar

科技巨头被曝未经授权用 YouTube 内容训练 AI，苹果、英伟达在列

据 Wired 报道，包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意，就使用了他们视频的字幕文件来训练人工智能模型。AI在线注意到，此次事件影响到的创作者包括知名科技博主 MKBHD (Marques Brownlee)、MrBeast、PewDiePie、以及脱口秀主持人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔等。这些被用于训练 AI 的字幕文件相当于视频的文本转录内容。调查记者披露，一些世界上最富有的科技公司一直在利用来自成千上万个 YouTube 视频的素材来训练 AI，而这违反了 You

英国监管机构出手，正调查微软与 Inflection AI 相关交易

英国竞争和市场管理局（CMA）7 月 16 日发布声明称，正调查微软雇佣 Inflection AI 部分前员工以及与 Inflection 方面达成相关安排的情况。该监管机构担心此举可能导致“竞争实质性减少”。图源 PexelsCMA 在声明中表示，做出第一阶段决定的截止日期为 9 月 11 日，届时该机构将宣布是否将此案转入第二阶段的深入调查。今年 4 月，CMA 曾表示正在征集公众意见，针对一系列科技巨头与人工智能初创公司的交易展开调查，其中包括微软与 Inflection AI 的交易、微软与 Mistra

人类模仿AI新赛道，AI：论疯癫，你是我爹

机器之能报道编辑：杨文AI被人类带坏！这个世界，太癫了……最近，社交媒体上冒出来一堆搞怪视频，打着 AI 的旗号，真人 cos AI，甚至抖音还专门出了个热门话题——人类模仿 AI 大赛。（视频来自抖音博主「关妮乱石」）视频链接：：左边一张旧照片，右边打着「AI 修复」的字幕，实际由真人演绎着脑干缺失的狗血「剧情」。-1-AI：第一次被人冒充，没想到比我还抽象自从可灵、Luma 发布以来，全球网友组团整活，什么特朗普和拜登打啵，鳌拜和韦小宝秀恩爱，奥特曼和黄仁勋打起来……只有你想不到，没有 AI「祸害」不到。（查看

美国参议员提跨党派提案：打击有害深度伪造，禁止篡改 AI 生成内容来源信息

来自共和民主两党的三位美国联邦参议院议员于当地时间 7 月 11 日宣布推出一项名为《保护内容来源和完整性，防止编辑和深度伪造媒体法案》的提案。AI在线注：这一法案英文全称为 Content Origin Protection and Integrity from Edited and Deepfaked Media Act，首字母简称为 COPIED ACT，后文以“COPIED 提案”代指。该提案旨在打击正在兴起的有害深度伪造，目标在美国联邦层面建立一个检测、标记与认证 AI 生成内容的透明度准则，保护记者、演

微软 CTO 坚信大型语言模型的“规模定律”依然奏效，未来可期

微软首席技术官（CTO）凯文・斯科特（Kevin Scott）上周在接受红杉资本旗下播客采访时，重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点，尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示：“其他人可能持不同观点，但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程，遗憾的是，你只能每隔几年才能看到一次，因为建造超级计算机然后用它们训练模型都需要时间。”202

微软 Recall 功能灵感来自 29 岁的比尔・盖茨的预言？早年节目录音流出

微软备受争议的 Windows Recall（回顾）功能是否出自 29 岁的比尔・盖茨的构想？近日，一档来自上世纪 80 年代中期广播节目的录音浮出水面，让人们不禁产生遐想。微软联合创始人盖茨当时只有 29 岁，他受邀参加了名为“知名电脑俱乐部”（The Famous Computer Cafe）的电台访谈节目。谈话中，盖茨阐述了他将个人电脑带入千家万户的愿景，以及赋予计算机学习能力的可能性。盖茨表示，随着用户的使用，计算机将能够学习并记住用户之前做过的操作，从而减少重复输入指令的麻烦。盖茨当时的设想与微软当前备受

谷歌 AI 概览多次产生错误内容后，现仅在 7% 的搜索中展示

Search Engine Land 报道称，5 月份 AI Overview（AI 概览）刚发布时，约有 80% 的搜索结果会出现 AI 概览，而现在 AI 概览仅在 7% 的搜索中展示。谷歌 5 月份在搜索中增加了 AI 概览功能，用户搜索问题时谷歌 AI 自动抓取网页内容生成总结，用户不需要点击每个搜索结果即可获得答案。据AI在线此前报道，有网友在谷歌搜索寻找“芝士和披萨粘不到一块”的解决办法时，谷歌 AI 提供的建议里却提到“你可以把 1/8 杯的无毒胶水加到酱料里，让其更黏”。随后谷歌发布相关声明，表示会

抛弃视觉编码器，这个「原生版」多模态大模型也能媲美主流方法

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]一作刁海文，是大连理工大学博士生，导师是卢湖川教授。目前在北京智源人工智能研究院实习，指导老师是王鑫龙博士。他的研究兴趣是视觉与语言，大模型高效迁移，多模态大模型等。共同一作崔玉峰，毕业于

智能化软件开发2.0 | aiXcoder落地Agent技术，聚焦企业项目级代码生成场景

基于大模型的AI Agent，作为能够自主感知环境、形成记忆、规划行动、并调用各类工具执行复杂任务的新一代技术，正在重塑软件开发流程，引领智能化软件开发进入2.0阶段。北大aiXcoder团队早在2023年初就开始基于大模型的Agent在软件工程领域中的研究，先后发表了多篇相关论文【1,2,3,4】，是全球第一批研究通过大模型＋工具调用去解决项目级代码生成问题的团队，为Agent技术在软件开发领域应用奠定了坚实的理论基础。基于系列领先的研究成果，结合多年来为各行业落地个性化企业代码大模型的实践经验，aiXcoder

大模型集体“失智”：9.11 和 9.9 哪个大，几乎全翻车了

没眼看……“9.11 和 9.9 哪个大”这样简单的问题，居然把主流大模型都难倒了？？强如 GPT-4o，都坚定地认为 9.11 更大。谷歌 Gemini Advanced 付费版，同样的口径。新王 Claude 3.5 Sonnet，还一本正经的给出离谱的计算方法。9.11 = 9 1/10 1/1009.9 = 9 9/10到这一步还是对的，但下一步突然就不讲道理了如上所示，9.11 比 9.90 大 0.01。你想让我进一步详细解释小数的比较吗？这你还解释啥啊解释，简直要怀疑是全世界 AI 联合起