AI资讯列表 - AI在线

陶哲轩支持！AI数学奥林匹克竞赛进步奖公布，奖金100多万美元

大模型做数学题到底如何，不妨让它参与一下这种级别的比赛。「AI 数学奥林匹克竞赛（AIMO 进步奖）的初步成绩已公布。根据排行榜的数据，目前看来，获胜的程序在私人测试中正确回答了 29/50 道题，这一成绩比预期的要高。」刚刚，陶哲轩在个人博客中公布了这一消息。AIMO 最初由一家搞机器学习量化交易的非银行金融机构 XTX Markets 发起，主要是让参与者使用 AI 模型解决国际数学难题，而本次进步奖的目标是创建能够解决用 LaTeX 格式编写的复杂数学问题的算法和模型。这将有助于推动人工智能模型的数学推理能

全新TextGrad框架：用GPT-4o作引擎，自动优化端到端任务

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]该文章的作者团队来自于斯坦福大学，共同第一作者团队Mert Yuksekgonul，Federico Bianchi, Joseph Boen, Sheng Liu, Zhi HuangM

央视点赞国产AI复活召唤术，兵马俑竟与宝石老舅对唱Rap？

沉睡了两千多年的兵马俑，苏醒了？一句秦腔开场，将我们带到了黄土高原。如果不是亲眼所见，很多观众可能难以想象，有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。「青海长云暗雪山，孤城遥望玉门关。」古调虽存音乐变，声音依旧动人情：这场表演背后的「AI 复活召唤术」，叫做 EMO，来自阿里巴巴通义实验室。仅仅一张照片、一个音频，EMO 就能让静止形象变为惟妙惟肖的唱演视频，且精准卡点音频中的跌宕起伏、抑扬顿挫。在央视《2024 中国・AI 盛典》中，同样基于 EMO 技术，北宋文学家苏轼被「复活」，与李玉刚同台合

一张照片创造 1 分钟人物视频，商汤发布首个“可控”人物视频生成大模型 Vimi

感谢商汤科技在世界人工智能大会（WAIC）上发布了首个“可控”人物视频生成大模型 Vimi，通过一张任意风格的照片就能生成和目标动作一致的人物类视频，并支持多种驱动方式，可通过已有人物视频、动画、声音、文字等多种元素进行驱动。与图片表情控制类技术只能控制头部表情动作不同，商汤称 Vimi 不但可以实现精准的人物表情控制，还可实现在半身区域内控制照片中人物的自然肢体变化，并自动生成与人物相符的头发、服饰及背景变化。同时 Vimi 可稳定生成 1 分钟的单镜头人物类视频，画面效果不会随着时间的变化而劣化或失真，满足娱乐

不到60秒就能生成3D「手办」，Meta发力3D生成，ChatGPT时刻要来了吗？

3D 生成，一直在等待它的「ChatGPT时刻」。一直以来，创作 3D 内容是设计和开发视频游戏、增强现实、虚拟现实以及影视特效中最重要的部分。然而，3D 生成具有独特而艰巨的挑战，这是图像和视频等其他生成内容所不具备的。首先，3D 内容在艺术质量、生成速度、3D 网格结构和拓扑质量、UV 贴图结构以及纹理清晰度和分辨率方面具有严格的标准；其次，与其他研究相比，可用的数据量少。虽然该领域有数十亿张图像和视频可供学习，但可用于训练的 3D 内容数量要少三到四个数量级。因此，现阶段的3D 生成还必须从非 3D 的图像和

AI助攻「菜鸟数学家」解决忙碌海狸问题，陶哲轩转发分享

在 AI 的帮助下，越来越多的数学问题得到了解决。AI在数学领域的应用对大家来说并不陌生了。数学家陶哲轩作为倡导者，一直走在使用AI辅助证明的前沿。他倡导使用像Lean和Coq这样的证明助手工具。这些工具可以形式化和验证复杂的数学证明，减少人为错误的可能性。也有不少数学家在他的启发下有了新成果，例如利用AI形式化费马大定理的证明。他参与了由Talia Ringer发起的AI在数学中资源列表的推广和编辑工作。这个资源列表专注于 AI for Math，为那些希望进入数学 AI 领域的人提供帮助。陶哲轩在推进项目研究进

ICML 2024高分论文 | 零阶优化器微调大模型，大幅降低内存

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文共同第一作者简介：张逸骅：密歇根州立大学计算机系博士三年级学生，师从Sijia Liu教授，主要研究方向是大模型的安全、隐私和效率问题。李平治：本科毕业于中国科学技术大学，将于2024

售价预计 2 万美元，特斯拉二代人形机器人 Optimus 亮相世界人工智能大会

据上证报报道，特斯拉二代人形机器人 Optimus 今日正式亮相 2024 世界人工智能大会（WAIC 2024）。第二代 Optimus 最早于去年 12 月 13 日首次亮相，相比前代产品，其改进包括如下方面：采用了全部由特斯拉自主设计和制造的执行器和传感器；整体外观设计更加精细；行走速度提高了 30%；重量减轻了 10 公斤，同时平衡感和身体控制能力得到改善，视频中演示了其做深蹲的动作；配备了全新的双手，能够抓握更重的物体并进行更加精细的操作。近期，二代 Optimus 已经在特斯拉工厂尝试“打工”。借助视觉

中国首款全尺寸通用人形机器人开源公版机“青龙”发布：高 185cm / 重 80kg，算力支持 400TOPS

据《上海证券报》报道，今天开幕的 2024 世界人工智能大会（WAIC 2024）期间，中国首款全尺寸通用人形机器人开源公版机“青龙”正式发布。IT之家汇总该机器人主要信息如下：“青龙”身高 185cm，体重 80kg，全身拥有 43 个主动自由度，关节峰值扭矩最大 400N・m，算力支持 400TOPS。其拥有高度仿生的躯干构型、拟人化的运动控制，支持多模态机动 / 感知 / 交互 / 操控。其同时具备高机动下肢行走配置、轻量化高精度上肢作业配置，支持快速行走、敏捷避障、稳健上下坡、抗冲击干扰四大运动功能。据报道

全球 AI 面临 6000 亿美元难题，人工智能泡沫正在接近临界点

【新智元导读】AI 基础设施的巨额投资，和实际的 AI 生态系统实际收入之间，差距已经到了不可思议的地步。曾经全球 AI 面临的 2000 亿美元难题，如今已经翻成了 6000 亿美元。现在，业内关于 AI 模型收入的质疑声，已经越来越大。动辄投入几万亿美元打造基础设施，跟部分国家的 GDP 不相上下，然而从 AI 模型中得到的回报，究竟能有几何？在 2023 年 9 月，来自红杉资本的 David Cahn 发表了一篇名为《AI 的 2000 亿美元问题》的文章，目的是探讨：「AI 的收入都去哪了？」根据报告，当

华为云 CEO 张平安：中国的 AI 应追求在行业领域构筑大模型的全球领先地位

感谢2024 世界人工智能大会今日在上海世博中心开幕，华为常务董事、华为云 CEO 张平安表示，中国的 AI 发展离不开算力基础设施的创新，并且要敢于开放行业场景，让 AI 在行业应用上领先。张平安提出，中国的 AI 发展道路，追求的应该是在行业领域构筑大模型的全球领先地位。如果各行各业都积极拥抱 AI，积极地开放行业的业务场景，中国很有机会在 2B 领域构筑起全球的领先优势。以钢铁行业为例，目前盘古大模型已经在宝钢的一条热轧生产线上线，预测钢板精度提高 5%，每年有望多生产 2 万吨钢板，增收 9000 多万元。

北京：预计两年打造 AI 原生城市，2025 年智算供给规模达 45EFLOPS

据上观新闻报道，在 7 月 3 日召开的 2024 全球数字经济大会智能计算与决策技术论坛上，北京市经济和信息化局总经济师、数字经济专班执行长唐建国表示：“北京市明确提出，到 2025 年本地智算供给规模达到 45EFLOPS，形成北京市内东西南北四个亿级以上算力中心，构建‘京津冀蒙’算力供给走廊，为人工智能大模型的训练和推理应用提供高效的算力供给。”IT之家注：EFLOPS 即每秒百亿亿次（10 的 18 次方）浮点运算次数。图源 Pexels唐建国表示，北京市还将推出一系列人工智能商业场景，预计利用两年时间打造

13瓦功耗处理10亿参数，接近大脑效率，消除LLM中的矩阵乘法来颠覆AI现状

编辑 | 萝卜皮通常，矩阵乘法 (MatMul) 在大型语言模型（LLM）总体计算成本中占据主导地位。随着 LLM 扩展到更大的嵌入维度和上下文长度，这方面的成本只会增加。加州大学、LuxiTech 和苏州大学的研究人员声称开发出一种新方法，通过消除过程中的矩阵乘法来更有效地运行人工智能语言模型。这从根本上重新设计了目前由 GPU 芯片加速的神经网络操作方式。研究人员描述了如何在不使用 MatMul 的情况下创建一个自定义的 27 亿参数模型，性能与当前最先进的 Transformer 模型相当。该研究以「Scal

Nature子刊，准确率达96%，AI从序列中预测蛋白-配体互作

编辑 | 萝卜皮在药物研发中，确定小分子配体对蛋白质的结合亲和力和功能效应至关重要。目前的计算方法可以预测这些蛋白质-配体相互作用特性，但如果没有高分辨率的蛋白质结构，通常会失去准确性，并且无法预测功能效应。莫纳什大学（Monash University）和格里菲斯大学（Griffith University）的研究人员开发了 PSICHIC（PhySIcoCHemICal graph neural network），这是一个结合物理化学约束的框架，可直接从序列数据解码相互作用指纹（fingerprints）。这使

实测最新AI语音模型：让特朗普、丁真说绕口令堪称以假乱真，但断句整得稀碎

机器之能报道编辑：杨文这款新AI语音模型Fish Speech，模仿音色一绝。近来，AI 语音赛道突然热闹起来。一个多月前，一个号称「开源语音 TTS 天花板级别」的 ChatTTS 爆火。火到什么程度呢？仅三天时间就在 GitHub 狂揽 9.2k Star 量，还一度登顶 GitHub Trending 榜首并连续霸榜。没多久，字节也推出一款类似项目 Seed-TTS，喊出的口号同样是「生成自然真实的语音」。这几天，这一赛道又闯进新玩家 ——Fish Speech。据悉，该模型经过 15 万小时的数据训练，已熟

中国移动董事长杨杰：AI 不会替代人，但擅长使用 AI 的人将替代不会使用 AI 的人

据澎湃新闻，在今日的 2024 世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上，中国移动董事长杨杰发表了有关“人工智能是否会替代人类”的看法。杨杰表示：“AI 到底是人类的助手还是对手、是机遇还是威胁，已经成为全社会共同的话题。我个人认为，AI 不会取代人类智能，但是会重构很多行业和领域，擅长使用 AI 的人将会替代不会使用 AI 的人。”百度创始人、董事长兼 CEO 李彦宏也提出了类似的看法。“很多人担心 AI 会抢走人类的工作机会，这是不无道理的。但 AI 扮演的更多是‘副驾驶’的角色，背后仍需人

联发科与快手推出端侧视频生成技术，支持天玑 9300/8300 移动平台

联发科与快手今日共同宣布，推出高效端侧视频生成技术。该技术是对 2024 世界移动通信大会上初次亮相的视频生成技术的延续与提升，结合快手的 AI 模型 I2V（image to video）Adapter 与联发科天玑 9300、天玑 8300 移动平台的 AI 算力，在端侧实现由静态图像生成动态视频。通过这项技术，用户只需在设备上选取图片，应用可识别照片中的人物和场景，生成自然流畅的视频，提升视频制作的创意表现和效率。I2V-Adapter 是快手 AI 团队提出的一种适用于基于 Stable Diffusion

2024世界人工智能大会暨人工智能全球治理高级别会议全体会议在上海举办，推动智能向善造福全人类

2024年7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议-全体会议在上海世博中心举办。联合国以及各国政府代表、专业国际组织代表，全球知名专家、企业家、投资家1000余人参加了本次会议，围绕“以共商促共享，以善治促善智”的大会主题展开深入交流研讨。多元交融的全球议题人工智能是人类发展新领域，其快速发展对经济社会发展和人类文明进步产生了深远影响，也带来了未知风险和复杂挑战。本届大会全体会议直面人工智能治理这一全球性议程，聚焦发展、安全、治理，开展了一系列国际性、跨领域、多视角的深入研讨。清华大学苏世民书