Stable

开源文生图 AI 重磅选手上新:Stable Diffusion 3.5 最强全家桶登场、消费级硬件上“开箱即用”

Stability AI 公司昨日(10 月 22 日)发布博文,宣布推出 Stable Diffusion 3.5,这标志着开源 AI 文生图模型的重大进步。Stable Diffusion 3.5 共有 Medium(10 月 29 日发布)、Large 和 Large Turbo 三种规模版本,旨在满足科学研究人员、爱好者、初创公司和企业的不同需求,AI在线附上相关介绍如下:Stable Diffusion 3.5 Large:共有 80 亿个参数,具有卓越的质量和快速响应,是 Stable Diffusion 家族中最强大的模型,非常适合 100 万像素分辨率的专业应用场景。Stable Diffusion 3.5 Large Turbo:是 Large 的精简版,在出色地遵循提示词上,仅需 4 个步骤内生成高质量图像,且生成速度明显快于 Large。

力压 DALL-E 3 等顶级模型,谷歌开放 Imagen 3 文生图 AI 访问

科技媒体 VentureBeat 报道,谷歌已经向美国用户正式开放了最新文生图 AI 模型 Imagen 3,用户可以打开 AI Test Kitchen 体验该功能,官方称最新版本“节更清晰、光照更丰富、干扰性人工痕迹更少”。谷歌于今年 5 月召开的 I / O 开发者大会上宣布 Imagen 3 模型,6 月邀请部分 Vertex AI 用户测试使用,而现在正式向美国用户开放。谷歌人工智能研究部门 DeepMind 负责人德米斯・哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,I

一张图即可 0.5 秒生成三维建模,Stability AI 推出“Stable Fast 3D”模型

Stability AI 今天推出了一款名为 Stable Fast 3D 的 AI 模型,该模型主打“图生 3D 模型”,号称只需 0.5 秒就能快速生成完整且自然的 3D 模型,目前该模型已在 Hugging Face 平台上架,感兴趣的小伙伴们可以(点此访问)。AI在线获悉,Stable Fast 3D 只需要单张图片即可快速生成高质量的 3D 模型,相关模型自带材质及对应的参数,同时提供了精确的 UV 展开(UV Unwrapping)便于用户进行后期修改,如果用户需要,还可以选择四边形或三角形网格重建功能

Stable Diffusion 3 开源倒计时,2B 单机可跑碾压闭源 Midjourney

【新智元导读】重磅消息!Stable Diffusion 3,大概率会在明天开源。距离 2 月 SD3 的横空出世,已经过去了 4 个月。如果此事为真,生图圈子第一个出现开源碾压闭源的奇景!强大的 MMDiT 全新架构,将彻底改变 AI 生图的格局。现在,全体 AI 社区都在翘首以盼。万众瞩目的 Stable Diffusion 3,终于要正式开源了!几天前,在 Computex 2024 大会上,Stability AI 联合首席执行官 Christian Laforte 正式官宣:SD 3 Medium 将在

Stable Audio Open 开源 AI 模型发布:48.6 万个样本训练,可创建 47 秒短音频 / 音效等

Stability AI 立足 Stable Diffusion 文生图模型,进一步向音频领域拓展,推出了 Stable Audio Open,可以基于用户输入的提示词,生成高质量音频样本。Stable Audio Open 最长可以创建 47 秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。Stable Audio Open 目前已经开源,IT之家附上相关链接,感兴趣的用户可以在 Hugging

快速入门大模型技术与应用,推荐你从Stable Diffusion开始学起

自 2023 年 AI 技术爆发以来,以 ChatGPT、Stable Diffusion 为代表的大模型已然成为了大众的焦点,其中 Stable Diffusion 作为知名的视觉开源模型,凭借直观易用与令人印象深刻的图像生成能力,赢得了创作者的广泛青睐。随着人工智能技术的不断进步和创新,Stable Diffusion 已经在艺术创作、设计领域乃至科学研究中展现出了独特的魅力和巨大的潜力。它不仅能够在短时间内生成高分辨率、细节丰富的图像,还能够通过简单的文本描述实现复杂视觉内容的创造,这使得 Stable Di

文生图 AI 巨头 Stability AI 被曝欠下近 1 亿美元,正与投资者洽谈融资事宜

综合路透社、The Information 消息,被视为文生图 AI 领域“巨头”之一的英国人工智能初创公司 Stability AI 发言人表示,该公司正与一批投资者洽谈大额股权融资事宜,以为当前资金短缺的 Stability AI 注入新的资金。该发言人表示,Stability AI 正与一家“世界知名的”技术投资集团进行独家合作。报道称,Stability AI 公司第一季度的收入不到 500 万美元(IT之家备注:当前约 3610 万元人民币),亏损超过 3000 万美元(当前约 2.17 亿元人民币),目

Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品

Stability AI 近日发布新闻稿,宣布推出 Stable Audio2.0,可以基于用户输入的提示词,生成最长 3 分钟的完整音轨。Stable Audio 2.0 在此前 1.0 版本基础上,进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容,最长可以生成 3 分钟的音频内容。Stable Audio 2.0 扩充了生成功能之外,还提供了音频生成音频功能,基于用户上传的一小段音频内容,扩展生成、补充相关的音频内容。IT之家附上演示视频如下: 例如音乐家如果在创作某段音乐的时候“卡壳”了,可以上传某段

大佬出走后首个发布,Stability 官宣代码模型 Stable Code Instruct 3B

【新智元导读】Stability AI 在大佬出走后似乎并未受到影响,最近又官宣了新的代码模型 Stable Code Instruct 3B,在之前的基础上更进一步,干掉了所有同级竞品,甚至能和 7B、15B 的模型掰手腕。大佬出走后,第一个模型来了!就在今天,Stability AI 官宣了新的代码模型 Stable Code Instruct 3B。要说 Stability 也是真的很神奇,首席执行官辞职了,Stable Diffusion 其中几位作者也离开了,投资公司出了点故障,自己的工资也可能要发不起了

Stable Code Instruct 3B AI 模型亮相:可精准翻译转换编程语言

Stability AI 公司近日面向程序员,推出 Stable Code Instruct 3B 大语言模型,其亮点在于可以从一种编程语言翻译转换成另一种编程语言。IT之家附上 Stable Code Instruct 3B 大语言模型的功能如下:该模型可以根据代码上下文情境自动生成代码。基于相关代码情境,自动插入、补全相关代码。Stable Code Instruct 3B 能够生成与数据库交互的代码。该模型可以将代码从一种编程语言翻译成另一种编程语言。该模型可以注释现有代码功能。根据用户指令,稳定代码指示器

可从单张图像创建多视图 3D 视频,Stability AI 发布 Stable Video 3D 模型

Stability AI 近日发布了 Stable Video 3D 模型,该模型可从单张图像创建多视图 3D 视频。▲ 图源 Stability AI,下同Stable Video 3D 包含两个变体,其中 SV3D_u 能基于单个图像输入生成轨道视频,无需相机调节;而 SV3D_p 扩展了 SVD3_u 的功能,其可容纳轨道视图,允许沿着指定的摄像机路径创建 3D 视频。相较之前的 Stable Zero123 模型或开源替代品 Zero123-XL,Stable Video 3D 在质量上有明显提高,并具有更

谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图

Speed Is All You Need:谷歌提出针对 Stable Diffusion 一些优化建议,生成图片速度快速提升。Stable Diffusion 在图像生成领域的知名度不亚于对话大模型中的 ChatGPT。其能够在几十秒内为任何给定的输入文本创建逼真图像。由于 Stable Diffusion 的参数量超过 10 亿,并且由于设备上的计算和内存资源有限,因而这种模型主要运行在云端。在没有精心设计和实施的情况下,在设备上运行这些模型可能会导致延迟增加,这是由于迭代降噪过程和内存消耗过多造成的。如何在设

平息画师怒火:Stable Diffusion学会在绘画中直接「擦除」侵权概念

Stable Diffusion 学会了「偷天换日」的本领。

PS上的开源Stable Diffusion插件来了:一键AI脑补,即装即用

网友:「它能颠覆整个行业。」

Stable Diffusion的魅力:苹果亲自下场优化,iPad、Mac上快速出图

输入一句话就能生成图像的 Stable Diffusion 已经火爆数月。它是一个开源模型,而且在消费级 GPU 上就能运行,是一项普通人就能接触到的「黑科技」。
  • 1