微软开源图片模型ART,可生成多图层透明图片

在图像生成领域,多层图像生成技术正逐渐改变用户与生成模型的互动方式,允许用户隔离、选择并编辑特定的图像层。 近日,微软研究人员推出了一种名为 “Anonymous Region Transformer”(ART)的新型技术,它能够根据全球文本提示和匿名区域布局,直接生成可变多层透明图像。 ART 的设计灵感来源于 “图式理论”,通过采用匿名区域布局,使生成模型可以自主决定哪些视觉信息与哪些文本信息对齐。

在图像生成领域,多层图像生成技术正逐渐改变用户与生成模型的互动方式,允许用户隔离、选择并编辑特定的图像层。近日,微软研究人员推出了一种名为 “Anonymous Region Transformer”(ART)的新型技术,它能够根据全球文本提示和匿名区域布局,直接生成可变多层透明图像。

QQ_1741139755445.png

ART 的设计灵感来源于 “图式理论”,通过采用匿名区域布局,使生成模型可以自主决定哪些视觉信息与哪些文本信息对齐。这一方法与以往的语义布局形成鲜明对比。传统的语义布局通常需要明确的对应关系,而 ART 的匿名区域布局则提供了更大的灵活性。

值得注意的是,ART 引入了一种逐层区域裁剪机制,该机制只选择与每个匿名区域相关的视觉信息,从而显著降低了注意力计算的成本。这种方法不仅加快了生成速度,使其比全注意力方法快12倍以上,还有效减少了图层之间的冲突,能够处理50个以上不同层次的图像生成。

此外,ART 还提出了一种高质量的多层透明图像自编码器,支持以联合方式直接编码和解码可变多层图像的透明度。这一创新设计为精确控制和可扩展的层生成提供了新的可能性,进一步推动了交互式内容创作的发展。

项目:https://art-msra.github.io/

划重点:

🌟 ART可根据全球文本提示和匿名区域布局,直接生成多层透明图像。  

⚡️ 采用逐层区域裁剪机制,显著提高了图像生成效率,比传统方法快12倍。  

💡 新型高质量自编码器支持多层透明图像的精确控制与生成,推动交互式内容创作。  

相关资讯

效果惊人!内置5种模型的AI图像生成神器「Dreamlike.art」

大家好,这里是和你们聊设计的花生~ 之前为大家推荐了一款上手非常容易的 AI 图像生成工具 Dream Studio,它操作界面简单易懂,非常适合刚接触 AI 图像生成工具的新手。最近又出现了一个新的同类型的 AI 图像生成神器 Dreamlike.art,操作界面同样好用且图像质量极高,即使是小白也能轻松生成精美的图像,效果可以跟上 Midjourney 的 V4 模型了。最最重要的是目前可以免费,使用一起来看看吧~ Dream Studio 介绍:Dreamlike.art 官网直达: (使用梯子速度更快,需

进入人工智能时代,设计师如何保持竞争力?

编者按:人工智能的时代已经来临,设计的方式正在发生改变,而曾经让设计师取得成功的要素也悄然变化。这篇文章将会探讨人工智能当前的状况,所产生的影响,未来可能发生的变化,以及设计师所需要应对的问题,和需要做好的准备。本文由设计师 Irina Nik 在 ChatGPT 和 Grammarly 的 AI 辅助下完成撰写。Irina 在完成文章之后,要求 ChatGPT 重写了部分段落让它们看起来更好。客观现实,而非炒作 人工智能革命并非未来,它是当下正在发生的客观事实。根据 Morning Consult 做过一个全球人

写给小白的大模型入门科普

什么是大模型? 大模型,英文名叫Large Model,大型模型。 早期的时候,也叫Foundation Model,基础模型。