应用 - AI在线

集体诉讼已受理：艺术家指控 Stability AI、Midjourney 等公司非法利用其版权内容训练 AI

美国当地法院主审法官昨日（8 月 13 日）裁定，可以继续推进 AI 图片训练集体诉讼案件，不过驳回了部分诉求。AI在线从报道中获悉，原告由多名艺术家组成，被告为 Stability AI、Midjourney 和其它 AI 相关公司，原告指控其非法使用版权作品用于训练 AI。该集体诉讼原告表示，目前诸多主流 AI 文生图服务所使用的数据集中，包含了他们创造的版权作品。法官威廉・奥里克（William Orrick）批准了针对 Stability 公司的额外诱导性版权侵权索赔，并受理原告对 DeviantArt（该

快手推出“飞船”App：基于“快意”AI 模型，主打虚拟陪伴

快手在发布可灵图生视频模型之后，最新推出了“飞船”（Kraft）AI 对话助手，提供个性化的对话体验。官方介绍称，飞船（Kraft）智能助手 App 是一款基于先进 AI 技术的互动软件，旨在提升用户的生活质量和工作效率。用户可以通过文字或语音与 AI 助手进行交流，解答疑问、获得娱乐、进行创作和角色定制等。用户在飞船平台上扮演“船长”角色，名为快快的 AI 少女领航员引导用户体验，飞船基于快手自研大模型“快意”，更侧重于虚拟陪伴，拥有快速的回复速度和逼真的语音体验。用户可以在该应用中创建和定制专属 AI 虚拟角色

谷歌发布 Gemini Live：支持 AI 语音聊天，可模拟面试场景、推荐演讲技巧

谷歌在今天召开的 Pixel 9 系列手机发布会上，发布了 Gemini Live 服务，将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式（限量 Alpha 测试），采用了增强型语音引擎，可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用

谷歌发布 Pixel Studio 本地 AI 文生图应用：基于 Imagen 3 模型，2 秒内生成

谷歌公司在今天召开的 Pixel 9 系列手机发布会上，推出名为 Pixel Studio 的全新图像生成应用，并表示将预装在每台 Pixel 9 系列手机上。用户可以在 Pixel Studio 应用中输入提示词，要求其生成图片。谷歌 Pixel Studio 应用采用本地运行生成，基于谷歌自己的 Imagen 3 模型，主要生成艺术风格的图片，而写实风格的图片效果比较差。以生成下面这张小猫为例，生成时间不超过 2 秒。谷歌 Pixel Studio 应用依赖谷歌 Tensor G4 SoC 芯片来生成图片，如果

神器大盘点！B站700万人气的AI整活视频都是如何完成的？

大家好，这里是和你们一起探索 AI 的花生~ 巴黎奥运会已经结束了，这段时间除了观看激动人心的竞赛，我的另一大乐趣就是在 B 站看各种奥运会的吐槽/整活视频。而在这个过程中，我也发现不少视频都用上了 AI 技术，给人带来了新的观看体验。那么今天就和大家聊聊其中比较新奇有趣的效果以及相关实现方法，说不定哪天你也用得上~ 相关推荐：一、视频角色替换首先是一个调侃在奥运会开幕式上出场的 “蓝精灵” 的视频。由于 “蓝精灵” 的装扮造型和 86 版《西游记》里的青狮怪非常相似，于是一个 B 站 up 主借用了电影《美人

3Cap 王康曼：我为什么投资 Cerebras Systems？

访谈 | 陈彩娴撰文丨朱可轩、赖文昕编辑丨陈彩娴本月初，美国知名 AI 芯片创业公司 Cerebras Systems 官宣，其已经向美国证券交易委员会 (“SEC”) 提交了一份有关其普通股首次公开发行的表格 S-1 登记声明草案——这一声明，进一步证实了外界对其今年计划上市的猜想。 Cerebras Systems 成立于 2015 年，创始人是 Andrew Feldman，是一家以打破英伟达垄断为目标的美国 AI 芯片创业公司。它们为业内熟知的标签有二：一是研发了世界上最大的芯片，从最初的 WSE-1到今年新发布的 WSE-3 均体量庞大；二是曾在 2018 年 D 轮获得 OpenAI CEO Sam Altman 的注资。

AI在用 | 微软总裁疯狂安利的AI小游戏，虐我千千万万遍

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。天啊噜，AI 真的成精了。最近，AI 生图真假难辨这事儿，闹得那叫一个沸沸扬扬。（查看详情，请移步：AI在用 | 三步速成AI美女，又被AI一秒打回原形）除了火爆全网的 AI 谷歌小姐姐，社交平台上又冒出了形形色色的 FLUX 生

非Transformer架构站起来了！首个纯无注意力大模型，超越开源巨头Llama 3.1

Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型不断出现，比如 Mistral 发布的首个基于 Mamba 架构的开源大模型 Codestral 7B。今天，阿布扎比技术创新研究所（TII）发布了一个新的开源 Mamba 模型 ——Falcon Mamba 7B。先来总结一波 Falcon Mamba 7B 的亮点

论文荣登计算机体系结构顶会ISCA，芯片架构成为边缘AI最佳并行计算选择

AI 大模型的爆发带动了 GPU 的强劲需求，从云端到边缘渗透的 AI 应用也将带动边缘 AI 服务器及加速处理器的需求。通过对比 GPGPU、FPGA、NPU 和 ASIC，可重构计算架构 CGRA 成为最适合边缘 AI 的并行计算架构。由芯动力提出的可重构并行处理器（RPP）是比传统 CGRA 更适合大规模并行处理的计算架构，这不但通过试验评测得到证实，而且也通过 ISCA 会议得到国际学术权威的认可。基于 RPP 架构的 R8 芯片及后续更高性能的迭代芯片将是边缘 AI 服务器和 AI PC 的理想 AI 加

不用部署，实现大模型切换自由！Token、算力免费薅！咱AI开发者今年整个秋天的奶茶都省出来了！

作为全公司产品做的最好的工程师，同时也是代码写得最好的产品经理，你深刻地知道：搞个靠谱的 AI 应用需要灵感，而好的灵感则需要一个靠谱的 demo 来验证。然而……当你已喝上了秋天的第一杯奶茶时，你的 demo 调用的却还是隔壁工位的小胡今年春天部署的第一个大模型…我们都知道：不是小胡懒得更新，而是帮你的 demo 换个模型 API 真的有点麻烦……首先，随着模型文件体积的不断增大，仅下载这些文件就需要花费个几天时间；而当文件下载完成后，又常常面临存储空间不足的问题，每增加一个新的模型版本，账单基数就又跳个台阶在下

开源AI视频工具，你只需要当导演，HuggingFace工程师打造

用 Clapper 做视频，你只需要当导演就行了。Sora 一出，视频领域似乎已经进入了生成式 AI 时代。不过直到今天，我们仍然没有用上 OpenAI 的官方视频生成工具，等不及的人们已经开始寻找其他的方法。最近几周，一款开源的视频编辑工具 Clapper 引发了人们的关注。与很多科技公司提供的视频生成器不同，Clapper 是一款开源 AI 故事可视化工具，于一年前推出原型。它的设计目的并非取代传统视频编辑器，或使用 3D 场景作为输入的现代 AI 编辑器。Clapper 的理念是集合各类生成式 AI 技术，让

首个支持普通话和方言混说的TTS大模型：河南话、上海话、粤语说得溜

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]自 2024 年 GPT-4o 出现以来，业内各公司纷纷投入巨大的资源进行 TTS 大模型的研发。近几个月内，中文语音合成大模型如雨后春笋般涌现，如 chattts、seedtts、cos

最强 AI 程序员 Genie 砸饭碗：84 秒跑通代码，像人一样思考，团队仅 5 人

继 Devin 之后，又一个 AI 软件工程师被刷屏了 —— 它叫 Genie，号称目前地表最强，已经可以像人一样思考和行动了！那么这个“地表最强”，到底强到什么程度？先来看下评测分数。在权威榜单 SWE-Bench 中，Genie 以解决了 30.07% 问题的成绩夺得榜首。（SWE-Bench 是一个用来评估大模型解决现实中软件问题的基准。）而这个成绩可谓是遥遥领先第二名 19.27%，解锁了提升 SOTA 的最大增幅 —— 57%！至于 Genie 的实际效果，用团队的话来说就是：它可以做到像人类工程师一样解

首位“AI 科学家”问世：已独立生成 10 篇学术论文，还顺手搞了 AI 审稿人

史上首位“AI 科学家”，横空出世！一登场就一口气生成了十篇完整学术论文。▲ AI 生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码，到在 GPU 上执行实验并收集结果，最后完成论文撰写，一气呵成。全由这位“AI 科学家”自动搞定。每篇论文的成本约为 15 美元（约 107.62 元）。这就是第一个用于自动化科学研究和开放式发现的综合 AI 系统，The AI Scientist。来自 Transformer 作者之一 Llion Jones 的创业公司：Sakana AI。而且！这公司搞的事情

斥资 6.65 亿美元，AMD 完成收购欧洲最大私人 AI 实验室 Silo AI

AMD 今日正式宣布，已完成对欧洲最大私人 AI 实验室 Silo AI 的收购，交易金额约为 6.65 亿美元（AI在线备注：当前约 47.73 亿元人民币），采用全现金支付。至此，Silo AI 的科学家和工程师正式加入 AMD 大家庭。AMD 对 AI 领域的重视不言而喻，此次收购是其战略布局的重要一步，旨在进一步强化公司在 AI 及相关技术领域的领导地位。与谷歌、Meta、苹果等科技巨头一样，AMD 也在积极向 AI 转型，但与之不同的是，AMD 在这一领域的投入相对较晚。AMD 加速计算事业部（AIG）高

Falcon Mamba 7B 开源模型登顶：换掉 Transformer，任意长序列都能处理

只是换掉 Transformer 架构，立马性能全方位提升，问鼎同规模开源模型！（注意力机制不存在了）这就是最新 Falcon Mamba 7B 模型。它采用 Mamba 状态空间语言模型架构来处理各种文本生成任务。通过取消传统注意力机制，有效提升了模型处理长序列时计算效率低下的问题。它可以处理无限长序列，但内存需求不增加。无论上下文多长，生成每个 token 的时间基本一样。由此，Falcon Mamba 模型性能全方位提升，打败一众 Transformer 架构模型，如 Llama-3.1（8B）、Mistra

「AI 数据荒」雪上加霜，MIT 发现网页数据的公开共享正走向衰落

人工智能系统依靠充足、高质量的训练数据来获得高性能，但 MIT 等机构最近的一项研究发现，曾经免费提供的数据在多个方面变得越来越难获取。随着 GenAI 产品开发和研究变得越来越广泛，训练数据的抓取许可也越来越成为受关注的话题。最近，吴恩达在网站 The Batch 上提及了一篇有关数据许可的研究，其结果似乎让本就迫近的「AI 数据荒」雪上加霜。研究人员发现，C4、RefineWeb、Dolma 等开源数据集所爬取的各种网站正在快速在收紧他们的许可协议，曾经触手可及的开放数据越来越难以获取。这不仅会影响商用 AI

复旦团队国际首次验证超快闪存集成工艺：20 纳秒超快编程、10 年非易失

感谢据复旦大学官方今日消息，人工智能的飞速发展迫切需要高速非易失存储技术。当前主流非易失闪存的编程速度在百微秒级，无法支撑应用需求。复旦大学周鹏-刘春森团队前期研究表明二维半导体结构能够将速度提升一千倍以上，实现颠覆性的纳秒级超快存储闪存。然而，如何实现规模集成、走向实际应用极具挑战。从界面工程出发，复旦大学团队在国际上首次验证了 1Kb 超快闪存阵列集成验证，并证明了超快特性可延伸至亚 10 纳米尺度。北京时间 8 月 12 日下午 5 点，相关成果以《二维超快闪存的规模集成工艺》（“A scalable int