混元

腾讯混元推出 5 个开源3D模型: 30 秒生成,兼容多平台

腾讯混元宣布推出5个全新3D生成模型,并全部开源。 这些基于Hunyuan3D-2.0打造的模型具有更快的生成速度、更丰富的细节和更逼真的材质表达。 同时,腾讯自研的3D AI创作引擎也进行了升级,现已向C端用户全面开放。

腾讯混元发布图生视频模型HunyuanVideo-I2V,并上线对口型等玩法

腾讯宣布开源其新研发的图像转视频生成框架 ——HunyuanVideo-I2V。 该模型的发布是在其成功开源 HunyuanVideo 之后的又一重要进展,旨在推动开放源代码社区的深入探索。 HunyuanVideo-I2V 结合了先进的视频生成技术,能够将静态图像转换为生动的视频内容,为创作者提供了更多的可能性。

腾讯混元新一代快思考模型 Turbo S 发布 即将在腾讯元宝中上线

2025年2月27日,腾讯正式发布混元新一代快思考模型Turbo S,标志着大模型技术在响应速度和性能优化方面取得了重要突破。 与传统的慢思考模型如Deepseek R1和混元T1不同,混元Turbo S能够实现“秒回”,大幅提升输出答案的速度,吐字速度提升一倍,首字时延降低44%。 这一创新使得模型在知识、数理、创作等多个领域表现出色,为大模型的快速响应能力提供了新的解决方案。

腾讯元宝超越豆包登上苹果中国区APP免费榜第二 DeepSeek稳坐第一

近日,苹果中国区 APP 免费榜迎来了新的变化,腾讯的元宝应用一跃而起,超越豆包,跻身排行榜第二位。 榜首的位置则被 DeepSeek 牢牢占据。 这一现象不仅反映了市场竞争的激烈,也展示了国内大模型行业快速发展的势头。

腾讯新搞了个深度思考模型,我们拿它和DeepSeek掐架

AI好好用报道编辑:杨文这波「左右互搏」有看头了。 腾讯向来以「慢」著称。 无论是游戏、搜索还是音乐、短视频,腾讯都比其他家慢了半拍。

腾讯推出AI合同起草功能,助力用户轻松生成法律文件

近日,腾讯电子签公众号宣布,将上线全新的 AI 起草合同功能。 该功能由混元和 DeepSeek 两大 AI 模型强力支持,旨在帮助用户实现一键生成合同,极大地方便了日常生活中的合同需求。 举个例子,刚刚步入社会的小王和朋友们决定一起租房,但对合同条款一知半解。

腾讯电子签将上线AI起草合同功能 接入混元、DeepSeek等大模型

近日,腾讯电子签公众号宣布即将上线AI起草合同功能。 这一创新功能将依托腾讯的混元、DeepSeek大模型技术,为用户提供一键生成合同的便捷服务。 在合同起草方面,AI能够一键生成合同。

近1.4万星,腾讯混元大模型开源成绩单公布,多次登顶开源趋势热榜

记者获悉,腾讯云副总裁,腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示,腾讯将开源协同作为公司的核心技术战略,积极推动内外部技术开源共享。 腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源,未来大模型各版本也将进一步开源,与社区开发者一起共同推动技术生态繁荣发展。 (腾讯云副总裁,腾讯混元大模型负责人 刘煜宏)腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态,是开源系列模型中较全的,其模型性能也得到了开源社区的高度认可,总GitHub Star(星星)数量近1.4万颗,并且多次登顶趋势榜。

腾讯混元大模型核心论文曝光:Scaling law、MoE、合成数据以及更多

随着 ChatGPT 的横空出世,大语言模型能力开始在各项领域(传统 NLP、数学、代码等)得到广泛验证,目前已经深刻影响到腾讯混元团队日常生活的方方面面。 腾讯混元团队长期致力于大语言模型的探索之路,大模型生产的各个环节开展研究创新以提升其基础能力,并将混元大模型的能力跟业务做深度结合,让生成式 AI 成为业务增长的放大器。 大语言模型的设计、训练和优化是一项复杂的系统工程,涉及到模型结构创新、训练范式优化、数据获取和评测设计、关键能力提升和挑战性问题的解决等方方面面。

腾讯发布新一代大模型“混元 Turbo”:推理效率提升 100%,成本降低 50%

感谢在今日的 2024 腾讯全球数字生态大会上,腾讯正式发布新一代大模型 —— 腾讯混元 Turbo。据腾讯官方介绍,该模型采用 MoE 架构,比上一代产品推理效率提升 100%,推理成本降低 50%。对外,腾讯混元 Turbo 的价格也比混元 Pro 降低 50%,输出价格为 0.05 元 / 千 tokens,输入价格为 0.015 元 / 千 tokens。9 月 2 日,中文大模型测评基准 SuperCLUE 发布《中文大模型基准测评 2024 年 8 月报告》,AI在线查询获悉,混元新一代大语言模型预览版

腾讯混元 DiT 文生图大模型开源 6G 小显存版本,一同开源打标模型

腾讯混元文生图大模型(混元 DiT)今日宣布开源小显存版本,仅需 6G 显存即可运行,对使用个人电脑本地部署的开发者比较友好。此外,腾讯宣布混元文生图打标模型“混元 Captioner”正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作文生图数据集。腾讯混元 DiT 模型升级腾讯混元 DiT 模型宣布了三大更新:推出小显存版本与 Kohya 训练界面,并升级至 1.2 版本,进一步降低使用门槛的同时提升图片质量。基于 DiT 架构的文生图模型生成图片质感更佳,但对显存的要求却非常高

腾讯混元文生图大模型开源训练代码,发布LoRA与ControlNet插件

6月21日,腾讯混元文生图大模型(以下简称为混元DiT模型)宣布全面开源训练代码,同时对外开源混元DiT LoRA 小规模数据集训练方案与可控制插件ControlNet。这意味着,全球的企业与个人开发者、创作者们,都可以基于混元DiT训练代码进行精调,创造更具个性化的专属模型,进行更大自由度的创作;或基于混元DiT的代码进行修改和优化,基于此构建自身应用,推动技术的快速迭代和创新。作为中文原生模型,用户在通过混元DiT的训练代码进行精调时,可以直接使用中文的数据与标签,无需再将数据翻译成英文。此前,腾讯混元文生图大

腾讯联合中山大学、港科大推出图生视频模型“Follow-Your-Pose-v2”

腾讯混元团队联合中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”,相关成果已经发表在 arxiv 上(IT之家附 DOI:10.48550/arXiv.2406.03035)。据介绍,“Follow-Your-Pose-v2”只需要输入一张人物图片和一段动作视频,就可以让图片上的人跟随视频上的动作动起来,生成视频长度可达 10 秒。与此前推出的模型相比,“Follow-Your-Pose-v2”可以在推理耗时更少的情况下,支持多人视频动作生成。此外,该模型具备较强的泛化能力,

腾讯混元文生图开源大模型加速库发布:生图时间缩短 75%

腾讯今日发布针对腾讯混元文生图开源大模型(混元 DiT)的加速库,号称大幅提升推理效率,生图时间缩短 75%。官方表示,混元 DiT 模型的使用门槛也大幅降低,用户可以基于 ComfyUI 的图形化界面使用腾讯混元文生图模型能力。同时,混元 DiT 模型已经部署至 HuggingFaceDiffusers 通用模型库中,用户仅用三行代码即可调用混元 DiT 模型,无需下载原始代码库。在此之前,腾讯曾宣布混元文生图大模型全面升级并对外开源,供企业、个人开发者免费商用。腾讯方面称其为“业内首个”中文原生的 DiT 架构

腾讯混元大模型全面降价!混元-lite即日起免费

5月22日,腾讯云公布全新大模型升级方案。主力模型之一混元-lite模型,API输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens调整为全面免费。混元-standard API输入价格从0.01元/千tokens降至0.0045元/千tokens ,下降55%,API输出价格从0.01元/千tokens降至0.005元/千tokens,下降50%。新上线的混元-standard-256k,具备处理超过38万字符的超长文本能力,API输入价格下调至0.015元/千tokens,下降87.

腾讯混元大模型全面降价,混元-lite 即日起免费

感谢今天,腾讯云公布全新大模型价格方案,其中主力模型之一混元-lite 模型,API 输入输出总长度计划从目前的 4k 升级到 256k,价格从 0.008 元 / 千 tokens 调整为全面免费。混元-standard API 输入价格从 0.01 元 / 千 tokens 降至 0.0045 元 / 千 tokens ,下降 55%,API 输出价格从 0.01 元 / 千 tokens 降至 0.005 元 / 千 tokens,下降 50%。新上线的混元-standard-256k,具备处理超过 38 万

腾讯将推 C 端助手 App 腾讯元宝:基于混元大模型,支持 AI 搜索、文档总结、口语陪练

感谢在今日举办的腾讯云生成式 AI 产业应用峰会上,腾讯预告将在 5 月 30 日发布基于混元大模型的面向 C 端(消费者端)的助手 App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合腾讯的内容生态,为用户提供多种生活功能。腾讯元宝将支持以下功能:AI 搜索:参考多个信息来源并总结,让信息获取更加准确、可靠文档总结:支持多格式多文档总结超能翻译官:直译意译均可翻译,用户可以提供论文链接,App 给出翻译口语陪练:练习口语对话,对用户语法与发音作出评价腾讯混元大模型,作为腾讯全链路

腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用

感谢腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在 Hugging Face 及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲ 混元文生图效果▲ 混元长文生图效果升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,腾讯表示,混元 DiT 是首个中英双语 DiT 架构。混元 DiT 是一个基于 Diffusion transformer 的文本到图像生成模型,此模型具有中英文细粒度理解能力,混元 DiT 能够与用户进行多轮对话,根据上下文生