腾讯混元文生图开源大模型加速库发布:生图时间缩短 75%

腾讯今日发布针对腾讯混元文生图开源大模型(混元 DiT)的加速库,号称大幅提升推理效率,生图时间缩短 75%。官方表示,混元 DiT 模型的使用门槛也大幅降低,用户可以基于 ComfyUI 的图形化界面使用腾讯混元文生图模型能力。同时,混元 DiT 模型已经部署至 HuggingFaceDiffusers 通用模型库中,用户仅用三行代码即可调用混元 DiT 模型,无需下载原始代码库。在此之前,腾讯曾宣布混元文生图大模型全面升级并对外开源,供企业、个人开发者免费商用。腾讯方面称其为“业内首个”中文原生的 DiT 架构

腾讯今日发布针对腾讯混元文生图开源大模型(混元 DiT)的加速库,号称大幅提升推理效率,生图时间缩短 75%。

官方表示,混元 DiT 模型的使用门槛也大幅降低,用户可以基于 ComfyUI 的图形化界面使用腾讯混元文生图模型能力。同时,混元 DiT 模型已经部署至 HuggingFaceDiffusers 通用模型库中,用户仅用三行代码即可调用混元 DiT 模型,无需下载原始代码库。

腾讯混元文生图开源大模型加速库发布:生图时间缩短 75%

在此之前,腾讯曾宣布混元文生图大模型全面升级并对外开源,供企业、个人开发者免费商用。腾讯方面称其为“业内首个”中文原生的 DiT 架构文生图开源模型,支撑中英文双语输入及理解。其采用与 sora 一致的 DiT 架构,不仅可支撑文生图,也可作为视频等多模态视觉生成的基础。

运转该模型需要支撑 CUDA 的英伟达 GPU,单独运转混元 DiT 所需的最低显存为 11GB,同时运转 DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元 DiT 则至少需要 32GB 的显存,腾讯表示他们已经在 Linux 上测试了英伟达的 V100 和 A100 GPU。

IT之家附链接:代码(GitHub)点此返回 模型(Hugging Face)点此返回

给TA打赏
共{{data.count}}人
人已打赏
AI

雪上加霜:因存起火隐患,Humane 通知 AI Pin 用户立即停止应用充电盒

2024-6-6 10:13:58

AI

Stable Audio Open 开源 AI 模型发布:48.6 万个样本训练,可创建 47 秒短音频 / 音效等

2024-6-6 14:15:01

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索