近1.4万星,腾讯混元大模型开源成绩单公布,多次登顶开源趋势热榜

记者获悉,腾讯云副总裁,腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示,腾讯将开源协同作为公司的核心技术战略,积极推动内外部技术开源共享。 腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源,未来大模型各版本也将进一步开源,与社区开发者一起共同推动技术生态繁荣发展。 (腾讯云副总裁,腾讯混元大模型负责人 刘煜宏)腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态,是开源系列模型中较全的,其模型性能也得到了开源社区的高度认可,总GitHub Star(星星)数量近1.4万颗,并且多次登顶趋势榜。

记者获悉,腾讯云副总裁,腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示,腾讯将开源协同作为公司的核心技术战略,积极推动内外部技术开源共享。腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源,未来大模型各版本也将进一步开源,与社区开发者一起共同推动技术生态繁荣发展。

近1.4万星,腾讯混元大模型开源成绩单公布,多次登顶开源趋势热榜

(腾讯云副总裁,腾讯混元大模型负责人 刘煜宏)

腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态,是开源系列模型中较全的,其模型性能也得到了开源社区的高度认可,总GitHub Star(星星)数量近1.4万颗,并且多次登顶趋势榜。

近1.4万星,腾讯混元大模型开源成绩单公布,多次登顶开源趋势热榜

其中,腾讯混元文生图大模型在国内外衍生数量达1600多个,GitHub Star 超过3700,凝聚了数千名核心开发者。腾讯混元large模型开源五天内即在HugginFace百万模型中脱颖而出,登趋势榜榜首,GitHub Star 达1300。腾讯混元3D模型GitHub Star达到2500,开源两周内成为HuggingFace下载增速最快的3D模型。

此外,腾讯混元文生视频大模型 GitHub Star 已超过6300 ,发布后迅速登上开源趋势热榜,社区开发者还主动改进了多个衍生版本。例如,加州大学圣地亚哥分校(UCSD)的Hao AI实验室研究员基于腾讯混元开源视频生成模型发布 FastHunyuan 版本,新模型仅用1分钟就能生成5秒长的视频,比之前提速8倍,步骤也从50步减少到了6步,有效降低了模型应用门槛。

2024是大模型技术持续爆发的一年,腾讯不仅坚持全链路自研的大模型研发路线,率先实现从底层算力网络到中间Angel机器学习平台再到上层模型和应用到全链路自研,也通过积极开源,将成熟的技术与社区共享。

2024年5月,腾讯旗下的混元文生图大模型全面升级并率先对外开源,包含模型权重、推理代码、模型算法等完整模型,属业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解。 评测数据显示,腾讯混元文生图模型效果远超开源的 Stable Diffusion 模型,是当时效果最好的开源文生图模型,整体能力属于国际领先水平。

11月,腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”开源,支持企业及开发者精调、部署等不同场景的使用需求。腾讯混元Large是当时开源领域参数规模最大、效果最好的MoE模型,而腾讯混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型。两个模型均属腾讯自研,在架构、算法、数据等方面有独特创新,填补了行业空白。

12月,腾讯混元生成视频大模型宣布开源,参数量130亿,是当前最大的视频开源模型,开源内容包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,能够节约大量人力及算力,加速行业创新步伐。

本届大会,腾讯还出品了数据库开源专题论坛并参与大模型开源专题论坛,将腾讯在数据库和大模型上的技术历程与众多开发者进行分享。

开源协同是腾讯的核心技术战略,腾讯通过代码的开源和协作,持续推动技术高效创新、开放共享。在腾讯内部,开源协同小组已经超过150个,覆盖人工智能、大数据、数据库等技术领域。对外,腾讯积极参与社区建设,主导近200个对外开源项目,在全球企业开源贡献榜上名列前茅,总共吸引超50万开发者关注。

早在2010年开始,腾讯就在公司层面开始推动外部开源工作的开展,现在已经由最初的开源的使用者,转变为开源项目的核心贡献者。同时,腾讯也是开放原子发起单位之一,自基金会2020年成立就积极参与开源,已捐赠操作系统、编译器、数据库等核心项目。

开源已经成为全球技术发展的主流趋势,基于全球开发者众研众创的开源生态正加速形成。全球97%的软件开发者和99%的企业使用开源软件,未来,腾讯也将持续推动技术开源,与技术社区共同成长,推动技术进步。

相关资讯

腾讯混元大模型核心论文曝光:Scaling law、MoE、合成数据以及更多

随着 ChatGPT 的横空出世,大语言模型能力开始在各项领域(传统 NLP、数学、代码等)得到广泛验证,目前已经深刻影响到腾讯混元团队日常生活的方方面面。 腾讯混元团队长期致力于大语言模型的探索之路,大模型生产的各个环节开展研究创新以提升其基础能力,并将混元大模型的能力跟业务做深度结合,让生成式 AI 成为业务增长的放大器。 大语言模型的设计、训练和优化是一项复杂的系统工程,涉及到模型结构创新、训练范式优化、数据获取和评测设计、关键能力提升和挑战性问题的解决等方方面面。

腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用

感谢腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在 Hugging Face 及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲ 混元文生图效果▲ 混元长文生图效果升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,腾讯表示,混元 DiT 是首个中英双语 DiT 架构。混元 DiT 是一个基于 Diffusion transformer 的文本到图像生成模型,此模型具有中英文细粒度理解能力,混元 DiT 能够与用户进行多轮对话,根据上下文生

腾讯将推 C 端助手 App 腾讯元宝:基于混元大模型,支持 AI 搜索、文档总结、口语陪练

感谢在今日举办的腾讯云生成式 AI 产业应用峰会上,腾讯预告将在 5 月 30 日发布基于混元大模型的面向 C 端(消费者端)的助手 App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合腾讯的内容生态,为用户提供多种生活功能。腾讯元宝将支持以下功能:AI 搜索:参考多个信息来源并总结,让信息获取更加准确、可靠文档总结:支持多格式多文档总结超能翻译官:直译意译均可翻译,用户可以提供论文链接,App 给出翻译口语陪练:练习口语对话,对用户语法与发音作出评价腾讯混元大模型,作为腾讯全链路