字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了

自字节跳动和POSTECH的研究团队发布了一项名为“1.58-bit FLUX”的突破性研究成果,该成果成功将最先进的文本到图像(T2I)生成模型FLUX.1-dev的权重参数量化至1.58比特,同时保持了生成1024x1024图像的质量,为在资源受限的移动设备上部署大型T2I模型开辟了新的道路,这项研究成果已发布在arXiv上,并配有开源代码库(代码目前还没有上传)AI画图模型也能“减肥”? 简单来说,就是把 FLUX(由Stable Diffusion作者团队成立的黑森林实验室Black Forest Lab推出) 的超强AI画图模型进行了“压缩”。 大家都知道,现在的AI画图模型,像DALLE 3、Stable Diffusion 3、Midjourney等,展现出强大的图像生成能力,在现实应用中潜力巨大。

自字节跳动和POSTECH的研究团队发布了一项名为“1.58-bit FLUX”的突破性研究成果,该成果成功将最先进的文本到图像(T2I)生成模型FLUX.1-dev的权重参数量化至1.58比特,同时保持了生成1024x1024图像的质量,为在资源受限的移动设备上部署大型T2I模型开辟了新的道路,这项研究成果已发布在arXiv上,并配有开源代码库(代码目前还没有上传)

字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了

AI画图模型也能“减肥”?

简单来说,就是把 FLUX(由Stable Diffusion作者团队成立的黑森林实验室Black Forest Lab推出) 的超强AI画图模型进行了“压缩”。大家都知道,现在的AI画图模型,像DALLE 3、Stable Diffusion 3、Midjourney等,展现出强大的图像生成能力,在现实应用中潜力巨大。然而,这些模型动辄数十亿的参数量和高昂的推理内存需求,使其难以在手机等移动端设备上部署

这就好比,你想用手机拍个8K超清电影,结果手机内存直接爆了,这不就尴尬了?

而 FLUX 这个模型,本来就已经很厉害了,现在又被“压缩”成了 1.58-bit FLUX,体积直接缩小了 7.7倍!这意味着,以后在手机上跑这些超强AI画图模型,不再是梦!

1.58-bit是啥?听起来很高端的样子

研究团队选择了开源且性能优异的FLUX.1-dev模型作为量化目标,探索了极低比特量化方案。通过将模型中99.5%的视觉Transformer参数量化至1.58比特,即限制参数值为{-1, 0, +1},并开发了专门针对1.58比特运算的定制化内核,1.58-bit FLUX在模型大小、推理内存和推理速度上都取得了显著的提升

其实,“1.58-bit”可以理解为一种超级高效的“打包”方式。你可以把AI模型的参数想象成一个个小积木,原本这些积木可能有很多种颜色、很多种形状。而“1.58-bit”就像是一个神奇的收纳盒,它把这些积木简化成了只有三种:“-1”、“0”和“+1”。

这样一来,原本需要很大空间才能存放的积木,现在用一个小小的盒子就能装下,而且这些积木还能拼出和原来几乎一样的图案!这波操作,是不是很像你平时用的压缩软件?只不过,这是针对AI模型做的超级压缩!

核心技术及创新

1. 数据无关的1.58比特量化: 与以往需要图像数据或混合精度方案的量化方法不同,1.58-bit FLUX的量化过程完全不依赖图像数据,仅通过对FLUX.1-dev模型进行自监督即可完成。这大大简化了量化流程,使其更具普适性

2. 定制化1.58比特运算内核: 为了进一步提升推理效率,研究团队开发了针对1.58比特运算优化的内核。该内核显著降低了推理时的内存占用,并提升了推理速度

实验结果及分析

实验结果表明,1.58-bit FLUX实现了以下显著提升:

• 模型存储减少7.7倍: 由于权重被量化为2比特有符号整数,模型存储空间大幅下降

• 推理内存减少5.1倍: 在各种GPU类型上,推理内存使用量均有显著降低,在A10-24G等资源受限的设备上尤为明显

• 推理速度提升: 特别是在L20和A10等性能较低的GPU上,推理速度提升高达13.2%字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了

“压缩”过的模型,画质会打折吗?

这可能是大家最关心的问题了。毕竟,如果画质变差了,那“瘦身”还有啥意义呢?

放心,研究团队早就想到了这一点!他们在 GenEval 和 T2I Compbench 这两个超权威的测试平台上,对“压缩”前后的模型进行了严格的对比测试。结果表明,1.58-bit FLUX 的画质,和原来几乎一模一样!

字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了

论文里还放出了大量的对比图,比如“一只在图书馆里行走的海水猫”、“一条在城市上空盘旋的火龙”等等,这些天马行空的画面,1.58-bit FLUX 都能轻松驾驭,细节满满,效果惊艳!

字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了

字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了

这黑科技,到底有什么用?

这项技术,最大的意义在于,它让我们看到了 在手机上运行大型AI画图模型的可能性! 以前,我们只能在电脑上,甚至是用专业的服务器才能体验到AI画图的乐趣。现在,随着 1.58-bit FLUX 的出现,未来我们也许只需要一部手机,就能随时随地进行AI创作!

相关资讯