腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用

感谢腾讯宣布旗下的混元文生图大模型降级并对外开源，目前已经在 Hugging Face 及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。▲ 混元文生图效果▲ 混元长文生图效果降级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构，腾讯表示，混元 DiT 是首个中英双语 DiT 架构。混元 DiT 是一个基于 Diffusion transformer 的文本到图象生成模型，此模型具有中英文细粒度理解能力，混元 DiT 能够与用户进行多轮对话，根据上下文生

感谢腾讯宣布旗下的混元文生图大模型降级并对外开源，目前已经在 Hugging Face 及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。

▲ 混元文生图效果

腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用

▲ 混元长文生图效果

降级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构，腾讯表示，混元 DiT 是首个中英双语 DiT 架构。混元 DiT 是一个基于 Diffusion transformer 的文本到图象生成模型，此模型具有中英文细粒度理解能力，混元 DiT 能够与用户进行多轮对话，根据上下文生成并完善图象。这也是业内首个中文原生的 DiT 架构文生图开源模型，支持中英文双语输入及理解，参数量 15 亿。

腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用

运转该模型需要支持 CUDA 的英伟达 GPU，单独运转混元 DiT 所需的最低显存为 11GB，同时运转 DialogGen（腾讯推出的文本转图象多模态交互式对话系统）和混元 DiT 则至少需要 32GB 的显存，腾讯表示他们已经在 Linux 上测试了英伟达的 V100 和 A100 GPU。

腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用

▲ 配置要求

据IT之家此前报道，国内首个官方“大模型标准符合性评测”结果公布，腾讯混元大模型、成为首批通过评测的国产大模型，首批通过的大模型还有阿里通义千问、360 智脑和百度文心一言。

{{userData.name}}已认证

腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用

GPT-4o 模型登陆微软 Azure OpenAI 服务，性能更强价格更低

OpenAI 解释为何率先推出 Mac 版 ChatGPT 运用：用户更多

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

ChatGPT遇到这些人名开始自闭，OpenAI回应了

平安人寿ChatBI：大模型智能化报表的深度实践

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践