AI资讯列表 - AI在线

昆仑万维发布全球首个 AI 流媒体音乐平台 Melodio：持续、稳定生成特定风格歌曲

昆仑万维今日宣布，正式发布全球首个 AI 流媒体音乐平台 Melodio，并同步推出 AI 音乐商用创作平台 Mureka。据介绍，用户根据此刻的场景或心情在 Melodio 输入 Prompt（提示），Melodio 便会持续生成相应风格的定制化音乐。用户在 Melodio 音乐生成与播放过程中可以随时修改输入文案，改变音乐生成内容，还能够实时查询生成的歌词，并对于喜欢的片段进行保存、分享。▲ Melodio 使用页面官方还表示，Melodio 是业内首个能够持续、稳定生成特定风格歌曲（如：中国风、Rap、DJ

全球最强AI程序员：GPT-4o加持，需求到跑通只需84秒

大家都在排 waitlist。大模型正在「替代人类程序员」的道路上快速前进。今年 3 月，人工智能软件工程师 Devin 引爆了 AI 社区，该产品由 OpenAI 的 GPT-4 基础大型语言模型（LLM）提供支持，可以在收到自然语言文本指令后自主编写和编辑代码。但在生成式 AI 领域，快速发展是主旋律，现在技术又迭代了。本周，一家 Y Combinator 支持，名为 Cosine 的创业公司宣布推出自己的全新自主 AI 工程师 Genie。该公司表示，Genie 的表现轻松超越了 Devin，在第三方基准测试

Fireworks乔琳：AI产品上市时间从五年压缩到五天，我们的秘诀是什么？

在大模型革命的第一波浪潮中，许多初创公司和企业基于领先的闭源模型，如OpenAI的ChatGPT设计自己的商业模式。然而，随着越来越多新的开源模型的出现，大模型从训练转向推理，基于大模型的商业模式也在悄然改变。最近，在人工智能领域，一家名为Fireworks AI的公司迅速崭露头角。

浩瀚智驾2.0首发，2025款极氪001、极氪007全能上市

今日，极氪智能科技正式发布2025款极氪001与2025极氪007，官方起售价分别为25.90万元和20.99万元。即日起，用户可通过极氪App、极氪官网、极氪小程序、全国各大城市的极氪门店等官方渠道进行预定。8月14日，2025款极氪001、极氪007将正式开启全国交付。2025款极氪001购车权益：2024年8月13日到2024年9月30日24:00（含）支付定金5000元的用户可享限时购车权益：极氪新车首任车主，于2024年9月 30日24:00（含）前下定的首台2025款极氪001可享10000元尾款抵扣。

AMD 6.65 亿美元收购 Silo AI；Genie 击败 Devin、GPT-4，刚获 250 万美元融资丨AI情报局

今日融资快报AMD 收购欧洲第一私人AI实验室 Silo AI 交易价值约6.65亿美元AMD 宣布，已经正式完成了对Silo AI的收购，后者是欧洲规模最大的私人人工智能实验室之一。此次交易的价值约为6.65亿美元，折合人民币约47.7亿元，AMD将全部以现金方式支付。这笔交易是自 Google 在 2014 年以约 4 亿英镑收购英国 DeepMind 之后，欧洲最大规模的私人 AI 创新公司并购案。

集体诉讼已受理：艺术家指控 Stability AI、Midjourney 等公司非法利用其版权内容训练 AI

美国当地法院主审法官昨日（8 月 13 日）裁定，可以继续推进 AI 图片训练集体诉讼案件，不过驳回了部分诉求。AI在线从报道中获悉，原告由多名艺术家组成，被告为 Stability AI、Midjourney 和其它 AI 相关公司，原告指控其非法使用版权作品用于训练 AI。该集体诉讼原告表示，目前诸多主流 AI 文生图服务所使用的数据集中，包含了他们创造的版权作品。法官威廉・奥里克（William Orrick）批准了针对 Stability 公司的额外诱导性版权侵权索赔，并受理原告对 DeviantArt（该

快手推出“飞船”App：基于“快意”AI 模型，主打虚拟陪伴

快手在发布可灵图生视频模型之后，最新推出了“飞船”（Kraft）AI 对话助手，提供个性化的对话体验。官方介绍称，飞船（Kraft）智能助手 App 是一款基于先进 AI 技术的互动软件，旨在提升用户的生活质量和工作效率。用户可以通过文字或语音与 AI 助手进行交流，解答疑问、获得娱乐、进行创作和角色定制等。用户在飞船平台上扮演“船长”角色，名为快快的 AI 少女领航员引导用户体验，飞船基于快手自研大模型“快意”，更侧重于虚拟陪伴，拥有快速的回复速度和逼真的语音体验。用户可以在该应用中创建和定制专属 AI 虚拟角色

谷歌发布 Gemini Live：支持 AI 语音聊天，可模拟面试场景、推荐演讲技巧

谷歌在今天召开的 Pixel 9 系列手机发布会上，发布了 Gemini Live 服务，将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式（限量 Alpha 测试），采用了增强型语音引擎，可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用

谷歌发布 Pixel Studio 本地 AI 文生图应用：基于 Imagen 3 模型，2 秒内生成

谷歌公司在今天召开的 Pixel 9 系列手机发布会上，推出名为 Pixel Studio 的全新图像生成应用，并表示将预装在每台 Pixel 9 系列手机上。用户可以在 Pixel Studio 应用中输入提示词，要求其生成图片。谷歌 Pixel Studio 应用采用本地运行生成，基于谷歌自己的 Imagen 3 模型，主要生成艺术风格的图片，而写实风格的图片效果比较差。以生成下面这张小猫为例，生成时间不超过 2 秒。谷歌 Pixel Studio 应用依赖谷歌 Tensor G4 SoC 芯片来生成图片，如果

神器大盘点！B站700万人气的AI整活视频都是如何完成的？

大家好，这里是和你们一起探索 AI 的花生~ 巴黎奥运会已经结束了，这段时间除了观看激动人心的竞赛，我的另一大乐趣就是在 B 站看各种奥运会的吐槽/整活视频。而在这个过程中，我也发现不少视频都用上了 AI 技术，给人带来了新的观看体验。那么今天就和大家聊聊其中比较新奇有趣的效果以及相关实现方法，说不定哪天你也用得上~ 相关推荐：一、视频角色替换首先是一个调侃在奥运会开幕式上出场的 “蓝精灵” 的视频。由于 “蓝精灵” 的装扮造型和 86 版《西游记》里的青狮怪非常相似，于是一个 B 站 up 主借用了电影《美人

3Cap 王康曼：我为什么投资 Cerebras Systems？

访谈 | 陈彩娴撰文丨朱可轩、赖文昕编辑丨陈彩娴本月初，美国知名 AI 芯片创业公司 Cerebras Systems 官宣，其已经向美国证券交易委员会 (“SEC”) 提交了一份有关其普通股首次公开发行的表格 S-1 登记声明草案——这一声明，进一步证实了外界对其今年计划上市的猜想。 Cerebras Systems 成立于 2015 年，创始人是 Andrew Feldman，是一家以打破英伟达垄断为目标的美国 AI 芯片创业公司。它们为业内熟知的标签有二：一是研发了世界上最大的芯片，从最初的 WSE-1到今年新发布的 WSE-3 均体量庞大；二是曾在 2018 年 D 轮获得 OpenAI CEO Sam Altman 的注资。

AI在用 | 微软总裁疯狂安利的AI小游戏，虐我千千万万遍

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。天啊噜，AI 真的成精了。最近，AI 生图真假难辨这事儿，闹得那叫一个沸沸扬扬。（查看详情，请移步：AI在用 | 三步速成AI美女，又被AI一秒打回原形）除了火爆全网的 AI 谷歌小姐姐，社交平台上又冒出了形形色色的 FLUX 生

非Transformer架构站起来了！首个纯无注意力大模型，超越开源巨头Llama 3.1

Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型不断出现，比如 Mistral 发布的首个基于 Mamba 架构的开源大模型 Codestral 7B。今天，阿布扎比技术创新研究所（TII）发布了一个新的开源 Mamba 模型 ——Falcon Mamba 7B。先来总结一波 Falcon Mamba 7B 的亮点

论文荣登计算机体系结构顶会ISCA，芯片架构成为边缘AI最佳并行计算选择

AI 大模型的爆发带动了 GPU 的强劲需求，从云端到边缘渗透的 AI 应用也将带动边缘 AI 服务器及加速处理器的需求。通过对比 GPGPU、FPGA、NPU 和 ASIC，可重构计算架构 CGRA 成为最适合边缘 AI 的并行计算架构。由芯动力提出的可重构并行处理器（RPP）是比传统 CGRA 更适合大规模并行处理的计算架构，这不但通过试验评测得到证实，而且也通过 ISCA 会议得到国际学术权威的认可。基于 RPP 架构的 R8 芯片及后续更高性能的迭代芯片将是边缘 AI 服务器和 AI PC 的理想 AI 加

不用部署，实现大模型切换自由！Token、算力免费薅！咱AI开发者今年整个秋天的奶茶都省出来了！

作为全公司产品做的最好的工程师，同时也是代码写得最好的产品经理，你深刻地知道：搞个靠谱的 AI 应用需要灵感，而好的灵感则需要一个靠谱的 demo 来验证。然而……当你已喝上了秋天的第一杯奶茶时，你的 demo 调用的却还是隔壁工位的小胡今年春天部署的第一个大模型…我们都知道：不是小胡懒得更新，而是帮你的 demo 换个模型 API 真的有点麻烦……首先，随着模型文件体积的不断增大，仅下载这些文件就需要花费个几天时间；而当文件下载完成后，又常常面临存储空间不足的问题，每增加一个新的模型版本，账单基数就又跳个台阶在下

开源AI视频工具，你只需要当导演，HuggingFace工程师打造

用 Clapper 做视频，你只需要当导演就行了。Sora 一出，视频领域似乎已经进入了生成式 AI 时代。不过直到今天，我们仍然没有用上 OpenAI 的官方视频生成工具，等不及的人们已经开始寻找其他的方法。最近几周，一款开源的视频编辑工具 Clapper 引发了人们的关注。与很多科技公司提供的视频生成器不同，Clapper 是一款开源 AI 故事可视化工具，于一年前推出原型。它的设计目的并非取代传统视频编辑器，或使用 3D 场景作为输入的现代 AI 编辑器。Clapper 的理念是集合各类生成式 AI 技术，让

首个支持普通话和方言混说的TTS大模型：河南话、上海话、粤语说得溜

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]自 2024 年 GPT-4o 出现以来，业内各公司纷纷投入巨大的资源进行 TTS 大模型的研发。近几个月内，中文语音合成大模型如雨后春笋般涌现，如 chattts、seedtts、cos

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

编辑 | ScienceAI一年前，谷歌最后一位 Transformer 论文作者 Llion Jones 离职创业，与前谷歌研究人员 David Ha共同创立人工智能公司 Sakana AI。Sakana AI 声称将创建一种基于自然启发智能的新型基础模型！现在，Sakana AI 交上了自己的答卷。Sakana AI 宣布推出 AI Scientist，这是世界上第一个用于自动化科学研究和开放式发现的 AI 系统！从构思、编写代码、运行实验和总结结果，到撰写整篇论文和进行同行评审，AI Scientist 开启