2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测!
一年前的今天,第一版天工大模型正式对外发布上线,一年来我们不断迭代模型,迭代应用产品,模型和应用都越做越好,以此回报广大用户的支持。
「天工3.0」拥有4000亿参数,超出了3140亿参数的Grok-1,是寰球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习才能等范畴拥有突破性的本能提升,数学/推理/代码/文创才能提升超过30%。
(天工3.0模型参数超出Grok-1,成寰球最大开源MoE专家混合大模型)
强大的模型技巧实力赋予「天工3.0」超强的本能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超出GPT-4V,寰球领先。
(天工3.0多模态本能超出GPT-4V,寰球领先)
同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开放公测。「天工SkyMusic」是中国首个音乐SOTA模型,更是中国的自研大模型技巧第一次在AIGC范畴领跑寰球。
(天工SkyMusic综合本能超出Suno V3,取得音乐大模型SOTA,领跑寰球)
天工SkyMusic:中国首个音乐AIGC SOTA模型
此前,大模型已经在文本、图像等多个技巧范畴取得突破,带来产业全面变革。然而,在AI音乐生成范畴,寰球迟迟等不到一款产品,开启「音乐ChatGPT时刻」。
这是因为一直以来,AI音乐行业大量钻研都集中在符号音乐生成技巧路线上,并且大多只能实现无人声背景音乐(Background Music,BGM)的生成,音乐的质量、效果、审美都远远达不到可用水平,产业迟迟未能爆发。
(「天工SkyMusic」自研AI音乐大模型技巧架构)
与行业主流路径不同,「天工SkyMusic」采用自研大模型音乐音频生成技巧路线。这一路线直接通过大模型技巧实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成,技巧难度极大,寰球只有包括昆仑万维在内的极少数顶尖玩家参与。
在与海外顶尖的AI音乐大模型Suno V3的横向测评中,「天工SkyMusic」在人声&BGM音质、人声自然度、发音可懂度等范畴显著领先对手,并以6.65分的综合得分超出Suno V3,成为寰球AI音乐SOTA模型。
此外,「天工SkyMusic」还拥有独创的参考音乐生成与方言歌曲生成才能。
参考音乐生成:用户可上传自有参考音乐,或选择「天工SkyMusic」资料库中现有的参考音乐,从而生成风格、唱腔类似的歌曲,进一步降低音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。
方言歌曲生成:「天工SkyMusic」生成的音乐不仅在人声自然度、发声可懂度等范畴表现优秀,更不妨支持粤语、成都话、北京话等众多方言,让用户不妨更自由地实现音乐表达,传播方言文化。
「天工SkyMusic」是中国首个公开可用的AI音乐生成模型,更是中国自研大模型技巧第一次在AIGC范畴领跑寰球。
当前,在文本大模型范畴,OpenAI吸引了寰球的注意力;但是在AI搜刮、AI音乐生成等细分范畴,中国玩家们正在奋勇前行,不断通过自研技巧取得细分范畴顶尖的SOTA表现,共同建设中国大模型产业,打造自主可控的大模型产业生态。
天工3.0:4000亿参数,寰球最大开源MoE大模型
在上一代「天工2.0」MoE大模型的领先基础上,「天工3.0」实现了全面的本能升级,采用了4000亿级参数MoE混合专家模型架构,是目前寰球模型参数最大、本能最强的开源MoE模型。
「天工3.0」的逻辑推理才能、语义理解才能、应对复杂需要才能、内容创作才能全面升级,并新增了多轮搜刮与综合对象挪用、图表绘制、钻研形式、增强形式、改图扩图等多项AI才能,为用户带来全新AI体验。
多轮搜刮与综合对象挪用:「天工3.0」针对模型独立规划、挪用、组合外部对象及整合信息的才能进行了专项训练,使其不妨独立生成并挪用代码,完成包括产业钻研、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需要。
同时,「天工3.0」不妨通过强大的语义理解才能将用户任务拆解成细分环节,实时判断是否需要联网或挪用对象,进行单轮或多轮的联网搜刮、对象挪用,完成包括多轮搜刮、热点信息分析、图片生成等复杂用户需要。
(Query:查询最新中国历史电影票房排行,图表展示)
图表绘制:「天工3.0」全面提高了逻辑推理才能与用户自然语言Query的理解才能,使其不妨更精准地判断用户需要,独立生成并挪用代码,结合文本需要实时进行内容分析及图表构建,为用户带来更直观、高效的对比结果。
(Query:北京、上海、重庆哪个好玩?)
多轮搜刮、综合对象挪用、图表绘制等都是「天工3.0」所独有的大模型综合才能,其从底层打通了「天工3.0」的AI搜刮、AI对话、AI代码生成、AI图片识别、AI图像生成等底层才能,通过语义识别才能直接触发,为用户带来更加便捷、高效的AI体验,成为真正的AI生产力对象。
此外,「天工3.0」中还增加了钻研形式、增强形式、改图扩图等多项AI才能。
钻研形式:在钻研形式中,「天工3.0」不妨围绕用户的某个简单指令进行相关问题的延伸,自动生成钻研大纲、图谱、实践总结、思维导图,帮助用户快速清晰地把握核心内容,完成用户复杂的钻研需要。
(Query:康乾盛世年代)
增强形式:在增强形式中,「天工3.0」不妨针对用户的复杂Query进行拆解、细化、并进行追问、信息理解与补全,使其在自然语义理解方面本能更强,面对不确定性知识时表现更好,不妨更精准、高效地满足用户需要。
(Query:2024年春节档电影;「天工3.0」理解并追问用户需要)
改图扩图:「天工3.0」多模态本能取得全面突破,超出GPT-4V,综合排名寰球第一。在强大的技巧底座支持下,「天工3.0」的AI绘图才能新增了图片尺寸扩展、图片定向调整、垫图生图、垫图进化、垫图扩图等全新功能。
(「天工3.0」的AI改图、修图、扩图等功能)
关于昆仑万维
自去年4月17日「天工」大模型正式推出以来,昆仑万维已围绕「天工」系列大模型建起AI大模型、AI搜刮、AI音乐、AI视频、AI社交、AI游戏等AI业务矩阵,是国内模型技巧与工程才能最强、布局最全面的人工智能科技企业之一。
这一年里,除了对「天工」系列基座大模型进行不断升级迭代,昆仑万维还推出了国内第一款AI搜刮引擎「天工AI搜刮」、开源了百亿级大语言模型「天工Skywork-13B」、推出国内领先的AI Agent开发平台「天工SkyAgents」等一系列前沿大模型产品。
当前,「天工」系列大模型已集成了AI音乐、AI搜刮、AI写作、AI长文本阅读、AI画图、AI语音合成、AI漫画创作、AI图片识别、AI代码写作、AI表格生成等多项才能,并将在未来加入AI视频功能,对标“超级应用”,成为人工智能时代的“超级大模型”(Super Model)。在“实现通用人工智能,让每个人更好地塑造和表达自我”的公司使命驱动下,昆仑万维将始终致力于AI技巧与产品的创新开拓,不断提高AI产品的用户体验,与用户、钻研人员、开发者们携手,共创国产大模型的未来。