AI资讯列表 - AI在线

谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能更强、响应更快

科技媒体 The Decoder 昨日（9 月 24 日）发布博文，报道谷歌升级旗下 Gemini 1.5 AI 模型，推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002，相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用，Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%，提高了两种模型的速率限制，并减少了延迟。新定价于 2024 年 10 月 1 日生效。性能更强AI在线援引新闻稿内

OpenAI 上线高级语音模式：翻开 AI 语音聊天新篇章，能用中文等 50 多种语言说“抱歉我迟到了”

感谢OpenAI 公司今天（9 月 25 日）发布博文，宣布面向所有 Plus 和 Team 订阅用户，推出高级语音模式（Advanced Voice Mode，简称 AVM），标志着人工智能对话技术向前迈出了重要一步。该功能之前仅邀请部分用户测试，OpenAI 希望通过语音，提供更自然、更像人类的交互体验。AI在线附上 AVM 主要功能如下：改善对话体验：AVM 可实现更流畅、反应更迅速的对话，让用户能够打断人工智能，并对话题的变化做出即时反应。新的声音：新增 Arbor、Maple、Sol、Spruce 和 V

大众携手谷歌，率先邀请约 12 万名车主免费使用 Gemini AI

大众汽车昨日（9 月 24 日）发布新闻稿，宣布携手谷歌公司，率先邀请约 12 万名大众 Atlas 和 Atlas Cross Sport 车型车主，免费体验和使用 Gemini AI 助手。Gemini AI 助手功能大众汽车在新闻稿中表示，通过与谷歌云（Google Cloud）的战略合作，在 myVW 移动应用中部署生成式人工智能。大众汽车车主可以通过聊天的方式和 Gemini AI 对话，掌控车辆状态或者请求其提供帮助。例如车主可以询问“如何更换备胎”，Gemini 就会自动调用 YouTube 视频，提

字节版Sora终于来了！一口气两款视频模型，带来的震撼不只一点点

我们用17个Prompt，实测了一把字节的两大视频生成模型。字节憋了个大招。9 月 24 日，字节跳动旗下的火山引擎在深圳办了一场 AI 创新巡展，一口气发布了两款视频生成大模型，正式宣告进军 AI 视频生成。这两款模型，一个名为 PixelDance（以下简称 P 模型），一个名为 Seaweed（以下简称 S 模型），不仅在审美、动幅上提升了一个 level，还破解了多主体互动和一致性难题。话不多说，先整几个视频让大家感受下：一位年轻女生微簇眉头，生气地戴上一副墨镜，这时，男主角入画，紧紧抱住了她。这段 10

破解AI算力瓶颈：高通量以太网ETH+协议解锁智算新动能

AI技术的爆发性增长引发了对计算能力的空前需求。这场由数据驱动的智能革命不仅为高性能计算技术的发展注入了新的活力，同时也带来了前所未有的挑战，要求算法优化、硬件升级、系统架构等多个维度都进行深度创新，以满足日益增长的计算密集型任务处理需求。高通量以太网联盟共同主席、阿里云研发副总裁、基础设施网络负责人蔡德忠在采访中谈到：“基于通用计算场景而构建的传统以太网数据中心网络架构只能提供 Best-effort （尽力而为的）网络性能，难以满足AI时代对高性能、高稳定性、高可扩展性的算力网络的需求。

真能这么简单？我居然 1 分钟就搞定了一个 IP 角色的 3D 建模

大家好，我是花生~ 今年 1 月份的时候，我给大家推荐过 5 款 AI 3D 模型生成工具，可以直接通过文本和图像生成 3D 模型。如今已经过去了半年多的时间，这些工具都有不同程度的发展，尤其 Tripo AI，一直在不断打磨自己的产品，不仅生成质量在提升，还添加了多图生成、骨骼绑定、重新拓扑等功能，给人的使用体验越来越好。前几天 Tripo AI 又推出了新的 2.0 模型，在建模精度、贴图质量上提升了一个新的维度，逼近人工建模的水平，因此具有极大的落地应用价值。下面就为大家详细一下介绍这个新模型的亮点。相

第四波！2024年9月精选实用设计工具合集

大家好，这是 2024 年 9 月的第 4 波干货合集！ AI 对于设计领域的深刻影响正在逐步显现，AI 直接提取文本生成海报、AI 生成高品质视频、AI 生成可迭代升级的数字产品，这是很多创作者和设计师都需要且期待的功能，如今都有平台逐步实现并且落地应用，今天的推荐当中，就包含有这几个类别的工具，虽有瑕疵，但是瑕不掩瑜，都值得关注。此外还有一个在线 PS 的平替，以及一套素质颇为不错的免费开源图标。当然，在继续阅读下去之前，记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货: 1、在线的 AI

任天堂出手：AI 生成的马力欧图片遭大规模下架

近期一款人工智能驱动的版权工具成功删除了大量包含 AI 生成的马里欧图片的 X 帖子，该工具属于一家名为 Tracer 的公司，该公司利用人工智能识别出了这些图像，并代表任天堂向 X 平台发出下架通知。根据 The Verge 收到的电子邮件，Tracer 的“客户成功经理”Ben Arzen 曾向 X 发出了一份《数字千年版权法》(DMCA) 通知。Tracer 向企业提供人工智能驱动的服务，据称能够识别在线的商标和版权侵权行为。下架请求包括被识别为侵犯任天堂马里欧版权的帖子，由于这些帖子现在已经被删除，无法看到

英国警方测试 AI 工具：可短时间分析大量数据，为破获悬案带来新希望

英国警方正在测试一款新的 AI 工具，有望帮助侦探们破获数十年前的悬案。据AI在线了解，这款名为 Söze 的工具由澳大利亚 Akkodis 公司开发，目前正在英国 Avon and Somerset 警方进行试验。该技术能够在数小时内分析多年的数据，包括视频、财务记录和社交媒体，从而为侦探们节省大量的时间。评估发现，Söze 仅用 30 个小时就审查了 27 个复杂案件的证据，而人类则需要数十年才能完成这项工作。英国国家警察局长委员会主席 Gavin Stephens 明确表示，AI 在悬案中的潜力巨大，因为大量

解码瓴羊：一群最懂数据的人如何让AI真正无处不在？

三年走来，每一步都「作数」。懂场景者得 AI短短一年多，全国已有 197 个 AI 大模型完成备案，行业大模型占比近 70%。伴随这一快速增长的趋势，一个现实问题不容忽视，如果不能和普通商家的现实需求紧密结合，大模型体验再好，也无法帮助大模型厂商自动完成商业闭环：扎堆商场一楼的新能源车销量大不如前，如何让高昂租金的产出性价比更高？某大型服装厂的数据表累积超过 3 亿多行，如果提炼不出价值，就只是成本；因为数字转型做得早，一堆业务系统竖起的数据「烟囱」让某乳业大品牌进退维谷；答非所问、反应滞后、人工客服难找，智能客

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

实验证明，大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型（LLM）的出现，人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近，OpenAI 发布了 o1 模型，一举创造了很多历史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，让大模型的上限从「没法看」直接上升到优秀水平，不专门训练直接数学奥赛金牌，甚至能在博士级别的科学问答环节上超越人类专家。那么，o1 模型是否具备上

伯克利MemGPT团队创业，要做开源的OpenAI，Jeff Dean也投了

他们提供的技术，或许会彻底改变人工智能行业。本周一，创业公司 Letta 面世的消息引发了人们的关注，它提供的技术可以帮助 AI 模型记住用户和对话。Letta 成立于加州大学伯克利分校（UC Berkeley）著名的实验室创业工厂，并已宣布获得了由 Felicis 的 Astasia Myers 领投的 1000 万美元种子资金，本轮估值为 7000 万美元。Letta 还得到了人工智能领域一系列天使投资人的支持，其中包括谷歌的 Jeff Dean、Hugging Face 的 Clem Delangue、Run

ACM TOG｜仅通过手机拍照就可以对透明物体进行三维重建

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本论文是由中国科学院计算技术研究所、加州大学圣芭芭拉分校和KIRI Innovations的研究人员合作完成。三维重建是计算机图形学的经典任务，具有很强的使用价值。近年来，诸如神经辐射场的

潞晨科技尤洋：300 亿市值的野心之上，我在做哪些选择？

作者｜朱可轩编辑｜陈彩娴作为2020年全球高性能计算领域在Google Scholar上引用次数最高的博士毕业生，尤洋曾被 UC Berkeley提名为ACM Doctoral Dissertation Award 候选人（81名UC Berkeley EECS 2020博士毕业生中选2人）。同时，他也是世界上唯一一位 35 岁以下在 4 个顶会（AAAI, ACL, IPDPS, ICPP）上以领导者的身份（第一作者或通讯作者）获得 Best Paper/Distinguished Paper 的人。 2021 年 7月，尤洋创立潞晨科技，转眼间，已经走进第三个年头。

华为发布星河 AI 自动驾驶网络解决方案：业界首个 L4 自动驾驶网络

在华为全联接大会 2024“星河 AI 自动驾驶网络”论坛上，华为发布了业界首个 L4 自动驾驶网络 —— 星河 AI 自动驾驶网络解决方案。▲ 图源华为华为数据通信产品线 NCE 数据通信领域总裁王辉在演讲中表示，该方案包括智能网元、数字孪生和智慧大脑三层架构，以集成百亿语料通信大模型、云图算法仿真等底层根能力，打造风险自识别、故障自闭环、变更自验证的 L4 自动驾驶网络，为金融、高校等多个行业打造了 AI 值守的运维专家。AI在线附三层架构如下：智能网元：毫秒级感知业务、流量、应用等全量数据，为整网智能化提供数

AI 牵线搭桥：日本东京政府推出人工智能相亲系统

不少人想通过互联网寻找伴侣，但又怕遭遇个人隐私泄露或诈骗。为此，日本东京都政府出手，推出官方背书的人工智能相亲系统，旨在帮助东京居民找到合适的伴侣。据东京政府 2021 年的一项调查显示，3267 名东京居民中有 67% 希望有一天结婚，但其中 69.3% 尚未迈出寻找潜在伴侣的第一步。这一系统名为“东京结缘”，于 9 月 20 日正式推出，面向在东京生活、学习或工作的 18 岁以上未婚人士。用户必须支付 1.1 万日元（AI在线备注：当前约 540 元人民币）购买两年使用资格，还需要多种认证并提供收入证明，接受系

自然指数公布 AI 研究增长最快 10 家机构：中国占据 6 席，中国科学院居首

国际知名学术出版机构施普林格・自然 9 月 20 日发布消息，最新上线的《自然》增刊“自然指数 2024 人工智能”显示，2019 年至 2023 年，有 10 家机构在自然指数中的人工智能（AI）研究产出增幅最大，其中，中国占据 6 席，中国科学院排名居首。根据自然指数，人工智能研究产出增幅最大的 10 家机构依次是：1、中国科学院2、哈佛大学3、北京大学4、清华大学5、浙江大学6、麻省理工学院7、马普学会8、德国亥姆霍兹国家研究中心联合会9、中国科学技术大学10、上海交通大学数据显示，发表在自然指数期刊上的人工

诺基亚、英伟达、T-Mobile 合作，共建业内首个 AI-RAN 创新中心

诺基亚今日宣布与美国 T-Mobile 和英伟达携手合作，共同建立业内首个 AI-RAN 创新中心，旨在利用 AI 技术增强无线网络，进一步提升网络速度、减少延迟、提高可靠性。该创新中心位于美国华盛顿州的贝尔维尤市（Bellevue，WA），致力于将诺基亚及其合作伙伴推向 AI、云计算与无线通信技术融合的前沿。诺基亚与合作伙伴将共同探索：GPU 和 AI 在提升 5G 及未来 6G 性能与效率方面的潜力；蜂窝网络的计算能力如何服务于 AI 等更多用途。诺基亚表示，随着扩展现实（extended reality）等新