AI资讯列表 - AI在线

OpenAI CEO 阿尔特曼：GPT-5 将带来“巨大飞跃”

OpenAI 公司的 GPT-5 模型一直备受关注，许多用户期待该公司会在春季更新活动中发布这款人工智能模型。然而，OpenAI 推出了新款旗舰产品 GPT-4o，该公司首席执行官山姆・阿尔特曼（Sam Altman）将其描述为“神奇”。根据 Aspen Ideas Festival 上的一次访谈，阿尔特曼提到，开发“GPT-5”还需要一些时间。“我们目前持乐观态度，但还有很多工作要做。”阿尔特曼表示。目前尚不清楚 GPT-5 的发布日期，但阿尔特曼表示它将是“巨大飞跃（significant leap forwa

优必选与一汽-大众达成合作，打造“人形机器人”超级无人汽车工厂

感谢据优必选官方消息，今日，优必选北京与一汽-大众达成合作，双方将在一汽-大众位于青岛的国家级智能制造示范工厂共同探索人形机器人在工业场景的深度应用，打造高智能化和柔性化的生产线及汽车超级无人工厂。据官方介绍，此次合作，一汽-大众将向优必选开放其位于青岛的“国家级智能制造示范工厂”生产线应用场景，引入工业版人形机器人 Walker S 开展汽车制造过程中的螺栓拧紧、零件安装、零件转运等工作。此外，双方还将在工业物流机器人、供应链等多个领域开展合作，助力人形机器人硬件降本。目前，优必选工业版人形机器人 Walker

Runway和Luma又打起来了！Yann LeCun炮轰：你们再牛，也不是「世界模型」

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。AI 视频界又「打」起来了！6 月 29 日，著名生成式 AI 平台 Runway 宣布，其最新模型 Gen-3 Alpha 向部分用户开启测试。同一天，Luma 推出关键帧新功能，并向所有用户免费开放使用。可谓是「你有张良计，我

腾讯搜狗输入法上线 AI 对话、AI 宠物、快捷问答等功能

腾讯搜狗输入法今日迎来 AI 功能上新，升级搭载 AI 帮写、AI 对话、快捷问答、AI 宠物、AI 自拍表情等多种玩法。IT之家获悉，AI 帮写号称“1 秒写标题 10 秒出全文”，提供 21 个帮写指令，包括聊天润色、全能帮写、购物神评、演讲稿生成、短视频动态、诗为你写诗、书影音评、写邮件、高赞朋友圈、个性签名、种草笔记、工作汇报、创意博文、知识分享、简历润色、自我介绍、考试祝福、爆款标题、神评论、求职话术、招聘文案。AI 对话功能提供 20 位“专家”帮用户出谋划策，例如腾讯混元助手、情感专家、起名大师、全能

从零开始，用英伟达T4、A10训练小型文生视频模型，几小时搞定

很翔实的一篇教程。OpenAI 的 Sora、Stability AI 的 Stable Video Diffusion 以及许多其他已经发布或未来将出现的文本生成视频模型，是继大语言模型 (LLM) 之后 2024 年最流行的 AI 趋势之一。在这篇博客中，作者将展示如何将从头开始构建一个小规模的文本生成视频模型，涵盖了从理解理论概念、到编写整个架构再到生成最终结果的所有内容。由于作者没有大算力的 GPU，所以仅编写了小规模架构。以下是在不同处理器上训练模型所需时间的比较。作者表示，在 CPU 上运行显然需要更长

ICML 2024| 大语言模型助力基于CLIP的分布外检测任务

当训练数据集和测试数据集的分布相同时，机器学习模型可以表现出优越的性能。然而在开放世界环境中，模型经常会遇到分布外（Out-of-Distribution, OOD，下称“OOD”）样本，OOD样本可能会导致模型做出不可预测的行为，而错误的后果可能是致命的，尤其是在自动驾驶等高风险场景中 [1, 2]。因此OOD检测对于保障机器学习模型在实际部署中的可靠性至关重要。大多数OOD检测方法 [1, 3] 可以基于训练有素的分布内 (In-Distribution, ID) 分类器有效地检测 OOD 样本。然而，对于不同

击败25个分子设计算法，佐治亚理工、多伦多大学、康奈尔提出大语言模型MOLLEO

作者 | 佐治亚理工学院王浩瑞编辑 | ScienceAI分子发现作为优化问题，因其优化目标可能不可微分而带来显著的计算挑战。进化算法（EAs）常用于优化分子发现中的黑箱目标，通过随机突变和交叉来遍历化学空间，但这会导致大量昂贵的目标评估。在这项工作中，佐治亚理工学院、多伦多大学和康奈尔大学研究者合作提出了分子语言增强进化优化（MOLLEO），通过将拥有化学知识的预训练大语言模型（LLMs）整合到进化算法中，显著改善了进化算法的分子优化能力。该研究以《Efficient Evolutionary Search Ov

重磅发布｜WAIC 2024展位图及参展企业名单完整公开！

2024世界人工智能大会暨人工智能全球治理高级别会议的展览展示将于7月4日-7日在世博展览馆盛大呈现。大会展览面积超5.2万平方米，重点围绕核心技术、智能终端、应用赋能三大板块，聚焦大模型、算力、机器人、自动驾驶等重点领域，集中展示一批“人工智能 ”创新应用最新成果，首发一批备受瞩目的创新产品，并特别挖掘100 个全球颇具创新前瞻性、成长潜力和商业价值的初创项目团队。以下为WAIC 2024完整展位图及参展企业名单，欢迎阅览！✦WAIC 2024完整参展企业名单✦

重磅发布｜产业发展主论坛嘉宾阵容曝光！

名称：产业发展主论坛地点：上海世博中心银厅时间：2024年7月4日13:00-16:302024世界人工智能大会暨人工智能全球治理高级别会议-产业发展主论坛将于2024年7月4日下午在世博中心举办。论坛将汇聚20余位国内外人工智能领域顶尖专家、业界领军人物、新锐力量及产业链各方代表，聚焦大模型、具身智能、AI基础设施、智能终端等前沿话题。全面解构通用人工智能产业新要素、新业态、新模式，剖析当下AI产业发展的全球性战略趋势。深度探讨大模型未来能力突破点、大模型时代的新智能终端、大模型驱动的新价值链形成，共话AI应用前

AI“恐怖”体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理

一段 AI 生成的体操视频，引发近百万网友围观，LeCun 等一众大佬还因为它吵起来了。体操表演，emmmm 怎么不算呢？通过视频右上角的水印，此段视频正是由那个一度被认为是“下一代”文生视频的 Dream Machine（来自 Luma AI）生成的。大伙儿看后纷纷坐不住，围绕此讨论的，是 AI 视频领域的一个熟悉的话题：AI 是否理解物理规律。LeCun 直接开麦：视频生成模型不理解基本物理知识。更不用说人体了。华盛顿大学计算机科学教授 Pedro Domingos 看后也“摇了摇头”：AGI 可能并不会像一些

速来！潞晨Open-Sora羊毛可薅，10元轻松上手视频生成

近期，视频生成模型赛道火热，文生视频，图生视频，花样层出不穷。然而，尽管市场上模型众多，大部分人还是因为没有内测资格无法体验，只能望 “模” 兴叹。前不久我们报道过潞晨科技的 Open-Sora 模型，作为全球首个开源类 Sora 模型，它不但在多种类型的视频上表现优异，还主打低成本且人人可用。它好用吗？怎么用？一起来看看机器之心的测评。最近 Open-Sora 全新开源的 1.2 版本，可以生成最长 16s 的 720p 高清视频，官方视频效果如下:这个生成的效果确实惊艳，也难怪后台那么多读者想要上手体验。对比一

AI 正在抢走谁的工作？一个人使用 ChatGPT 取代了 60 名员工

【新智元导读】ChatGPT 发布一年多来，总是有人担心自己的工作会被取代，但最后总是演变成「狼来了」的故事。但这次不一样了，ChatGPT 它来真的。BBC 的一篇报道，让 reddit 网友吵得不可开交。报道是这样的：一个由 60 多位编辑和作家组成的团队，负责为科技公司撰写和编辑文章，逐渐被 ChatGPT 所取代，团队只剩下 1 个人和 1 个 ChatGPT。剩下的这个人，每天做的事情就是修改 ChatGPT 生成的内容，让它显得没那么像机器生产的。ChatGPT 变成了主笔，人类则更像机器。编辑们的「饭

人刚毕业，颠覆整个AI界：扒一扒Sora两带头人博士论文

看看这个时代最伟大 AI 学者的研究脉络。2024 年是生成式 AI 元年，才到 2 月，OpenAI 就用 Sora 把竞争推向了视频生成的新高度。我们都还记得初见 Sora 作品时受到的震撼，感叹其他竞争对手想要赶上 OpenAI，至少也得需要个半年到一年的时间。Sora 发布后，其开发团队自然也成为关注焦点，人们都想知道具有跨时代意义的 AI 技术是如何被开发出来的。DiT 模型作者谢赛宁曾表示：「他们每天基本不睡觉高强度工作了一年」。随着时间推移，答案正被慢慢揭晓。以下是 OpenAI 技术报告中，Sora

最难「讨好」的消费者，竟然都被AIGC征服了？

说到「营销互动」，你会想到什么？从传统媒介到互联网时代，互动营销都在行业中占据一席之地。具体形式可能是报纸一角的创意广告，可能是花样百出的 H5 或微信小程序，也可能是手机屏与电视屏之间的互动。总之，互动营销需要结合具体的媒介形式，为品牌方和消费者之间搭建起一个巧妙的沟通场景。在过去的一年多，大模型技术在各个环节变革了营销行业，包括底层技术、内容创新，以及拓展品牌方与消费者的互动深度和广度。AIGC 时代，营销互动能玩出哪些新花样？底层技术的进步，又为营销行业带来哪些全新的互动场景？在火山引擎和 NVIDIA 联手

等不来OpenAI的Q*，华为诺亚探索LLM推理的秘密武器MindStar先来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本论文作者来自华为蒙特利尔诺亚方舟实验室的康计堃，李信择，陈熙， Amirreza Kazemi，陈博兴。人工智能（AI）在过去十年里取得了长足进步，特别是在自然语言处理和计算机视觉领域。

ICML 2024 Spotlight | 在解码中重新对齐，让语言模型更少幻觉、更符合人类偏好

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文介绍了一篇语言模型对齐研究的论文，由瑞士、英国、和法国的三所大学的博士生和 Google DeepMind 以及 Google Research 的研究人员合作完成。其中，通讯作者 T

特斯拉将参加 2024 世界人工智能大会：展出 Cybertruck、FSD 自动驾驶最新成果等

感谢据《科创板日报》今日报道，在今年世界人工智能大会（WAIC 2024）期间，特斯拉将展示其 Cybertruck（赛博越野旅行车）、Optimus 人形机器人、FSD（完全自动驾驶能力）最新成果等。其中，特斯拉 Optimus 人形机器人现已可在工厂里执行任务，预计 2025 年，将有超过 1000 个 Optimus 人形机器人在特斯拉工厂内工作；Cybertruck 是世界首款采用 48V 低压架构的车型，也是首款采用线控转向的量产车型，即完全用电能实现转向。据IT之家此前报道，2024 世界人工智能大会将

联想刘军：构筑「AI大脑」，让用户获得「个人AI助理」新体验

6 月 25 日，联想在杭州举办了 “让世界充满 AI”—— 联想 AI 终端 “一体多端” 战略暨消费新品夏季发布会。联想集团执行副总裁兼中国区总裁刘军在会上表示，联想希望通过 “一体多端” 战略，领跑 AI PC、AI 手机、AI 平板和 AIoT。“一体多端” 战略的目标只有一个，即：让用户在工作、学习和生活的不同场景下，都拥有 “个人 AI 助理”。联想的 “一体多端” 战略的 “一体” 是 “天禧智能体系统”—— 天禧 AS，由联想 “小天” 个人智能体，以及个人知识库、AI 应用平台、超级互联、数据安全