Stable

开源文生图 AI 重磅选手上新：Stable Diffusion 3.5 最强全家桶登场、消费级硬件上“开箱即用”

Stability AI 公司昨日（10 月 22 日）发布博文，宣布推出 Stable Diffusion 3.5，这标志着开源 AI 文生图模型的重大进步。Stable Diffusion 3.5 共有 Medium（10 月 29 日发布）、Large 和 Large Turbo 三种规模版本，旨在满足科学研究人员、爱好者、初创公司和企业的不同需求，AI在线附上相关介绍如下：Stable Diffusion 3.5 Large：共有 80 亿个参数，具有卓越的质量和快速响应，是 Stable Diffusion 家族中最强大的模型，非常适合 100 万像素分辨率的专业应用场景。Stable Diffusion 3.5 Large Turbo：是 Large 的精简版，在出色地遵循提示词上，仅需 4 个步骤内生成高质量图像，且生成速度明显快于 Large。

10/23/2024 9:05:11 AM

故渊

力压 DALL-E 3 等顶级模型，谷歌开放 Imagen 3 文生图 AI 访问

科技媒体 VentureBeat 报道，谷歌已经向美国用户正式开放了最新文生图 AI 模型 Imagen 3，用户可以打开 AI Test Kitchen 体验该功能，官方称最新版本“节更清晰、光照更丰富、干扰性人工痕迹更少”。谷歌于今年 5 月召开的 I / O 开发者大会上宣布 Imagen 3 模型，6 月邀请部分 Vertex AI 用户测试使用，而现在正式向美国用户开放。谷歌人工智能研究部门 DeepMind 负责人德米斯・哈萨比斯（Demis Hassabis）说，与前代产品 Imagen 2 相比，I

8/16/2024 8:59:36 AM

故渊

一张图即可 0.5 秒生成三维建模，Stability AI 推出“Stable Fast 3D”模型

Stability AI 今天推出了一款名为 Stable Fast 3D 的 AI 模型，该模型主打“图生 3D 模型”，号称只需 0.5 秒就能快速生成完整且自然的 3D 模型，目前该模型已在 Hugging Face 平台上架，感兴趣的小伙伴们可以（点此访问）。AI在线获悉，Stable Fast 3D 只需要单张图片即可快速生成高质量的 3D 模型，相关模型自带材质及对应的参数，同时提供了精确的 UV 展开（UV Unwrapping）便于用户进行后期修改，如果用户需要，还可以选择四边形或三角形网格重建功能

8/2/2024 10:45:08 PM

漾仔

Stable Diffusion 3 开源倒计时，2B 单机可跑碾压闭源 Midjourney

【新智元导读】重磅消息！Stable Diffusion 3，大概率会在明天开源。距离 2 月 SD3 的横空出世，已经过去了 4 个月。如果此事为真，生图圈子第一个出现开源碾压闭源的奇景！强大的 MMDiT 全新架构，将彻底改变 AI 生图的格局。现在，全体 AI 社区都在翘首以盼。万众瞩目的 Stable Diffusion 3，终于要正式开源了！几天前，在 Computex 2024 大会上，Stability AI 联合首席执行官 Christian Laforte 正式官宣：SD 3 Medium 将在

6/12/2024 3:50:42 PM

清源

Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频 / 音效等

Stability AI 立足 Stable Diffusion 文生图模型，进一步向音频领域拓展，推出了 Stable Audio Open，可以基于用户输入的提示词，生成高质量音频样本。Stable Audio Open 最长可以创建 47 秒的音乐，非常适合鼓点、乐器旋律、环境音和拟声音效，该开源模型基于 transforms 扩散模型（DiT），在自动编码器的潜在空间中操作，提高生成音频的质量和多样性。Stable Audio Open 目前已经开源，IT之家附上相关链接，感兴趣的用户可以在 Hugging

6/6/2024 2:15:01 PM

故渊

快速入门大模型技术与应用，推荐你从Stable Diffusion开始学起

自 2023 年 AI 技术爆发以来，以 ChatGPT、Stable Diffusion 为代表的大模型已然成为了大众的焦点，其中 Stable Diffusion 作为知名的视觉开源模型，凭借直观易用与令人印象深刻的图像生成能力，赢得了创作者的广泛青睐。随着人工智能技术的不断进步和创新，Stable Diffusion 已经在艺术创作、设计领域乃至科学研究中展现出了独特的魅力和巨大的潜力。它不仅能够在短时间内生成高分辨率、细节丰富的图像，还能够通过简单的文本描述实现复杂视觉内容的创造，这使得 Stable Di

5/29/2024 3:10:00 PM

机器之心

文生图 AI 巨头 Stability AI 被曝欠下近 1 亿美元，正与投资者洽谈融资事宜

综合路透社、The Information 消息，被视为文生图 AI 领域“巨头”之一的英国人工智能初创公司 Stability AI 发言人表示，该公司正与一批投资者洽谈大额股权融资事宜，以为当前资金短缺的 Stability AI 注入新的资金。该发言人表示，Stability AI 正与一家“世界知名的”技术投资集团进行独家合作。报道称，Stability AI 公司第一季度的收入不到 500 万美元（IT之家备注：当前约 3610 万元人民币），亏损超过 3000 万美元（当前约 2.17 亿元人民币），目

5/17/2024 8:12:25 PM

清源

Stable Audio 2.0 发布：生成最长 3 分钟音频，能帮音乐家补全创意作品

Stability AI 近日发布新闻稿，宣布推出 Stable Audio2.0，可以基于用户输入的提示词，生成最长 3 分钟的完整音轨。Stable Audio 2.0 在此前 1.0 版本基础上，进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容，最长可以生成 3 分钟的音频内容。Stable Audio 2.0 扩充了生成功能之外，还提供了音频生成音频功能，基于用户上传的一小段音频内容，扩展生成、补充相关的音频内容。IT之家附上演示视频如下：例如音乐家如果在创作某段音乐的时候“卡壳”了，可以上传某段

4/4/2024 10:23:56 AM

故渊

大佬出走后首个发布，Stability 官宣代码模型 Stable Code Instruct 3B

【新智元导读】Stability AI 在大佬出走后似乎并未受到影响，最近又官宣了新的代码模型 Stable Code Instruct 3B，在之前的基础上更进一步，干掉了所有同级竞品，甚至能和 7B、15B 的模型掰手腕。大佬出走后，第一个模型来了！就在今天，Stability AI 官宣了新的代码模型 Stable Code Instruct 3B。要说 Stability 也是真的很神奇，首席执行官辞职了，Stable Diffusion 其中几位作者也离开了，投资公司出了点故障，自己的工资也可能要发不起了

3/29/2024 11:22:55 PM

清源

Stable Code Instruct 3B AI 模型亮相：可精准翻译转换编程语言

Stability AI 公司近日面向程序员，推出 Stable Code Instruct 3B 大语言模型，其亮点在于可以从一种编程语言翻译转换成另一种编程语言。IT之家附上 Stable Code Instruct 3B 大语言模型的功能如下：该模型可以根据代码上下文情境自动生成代码。基于相关代码情境，自动插入、补全相关代码。Stable Code Instruct 3B 能够生成与数据库交互的代码。该模型可以将代码从一种编程语言翻译成另一种编程语言。该模型可以注释现有代码功能。根据用户指令，稳定代码指示器

3/27/2024 9:42:54 AM

故渊

可从单张图像创建多视图 3D 视频，Stability AI 发布 Stable Video 3D 模型

Stability AI 近日发布了 Stable Video 3D 模型，该模型可从单张图像创建多视图 3D 视频。▲ 图源 Stability AI，下同Stable Video 3D 包含两个变体，其中 SV3D_u 能基于单个图像输入生成轨道视频，无需相机调节；而 SV3D_p 扩展了 SVD3_u 的功能，其可容纳轨道视图，允许沿着指定的摄像机路径创建 3D 视频。相较之前的 Stable Zero123 模型或开源替代品 Zero123-XL，Stable Video 3D 在质量上有明显提高，并具有更

3/21/2024 10:53:01 AM

溯波（实习）

谷歌下场优化扩散模型，三星手机运行Stable Diffusion，12秒内出图

Speed Is All You Need：谷歌提出针对 Stable Diffusion 一些优化建议，生成图片速度快速提升。Stable Diffusion 在图像生成领域的知名度不亚于对话大模型中的 ChatGPT。其能够在几十秒内为任何给定的输入文本创建逼真图像。由于 Stable Diffusion 的参数量超过 10 亿，并且由于设备上的计算和内存资源有限，因而这种模型主要运行在云端。在没有精心设计和实施的情况下，在设备上运行这些模型可能会导致延迟增加，这是由于迭代降噪过程和内存消耗过多造成的。如何在设

4/27/2023 2:25:00 PM

机器之心