天工大模型 4.0 o1 版 / 4o 版上线,App 及网页可免费使用

天工大模型4.0 o1版号称国内首款具备中文逻辑推理能力的o1模型,不仅包含上线即开源的模型,还有两款性能更强的专用版本。其能够熟练处理各种推理挑战,包括数学、代码、逻辑、常识、伦理决策等问题。

昆仑万维集团今日宣布,天工大模型 4.0 o1 版和 4o 版同步上线,全量登陆网页端和 App 端,可免费使用。

天工大模型 4.0 o1 版号称国内首款具备中文逻辑推理能力的 o1 模型,不仅包含上线即开源的模型,还有两款性能更强的专用版本。其能够熟练处理各种推理挑战,包括数学、代码、逻辑、常识、伦理决策等问题。

天工大模型 4.0 4o 版则是一款多模态模型,官方还推出了由其赋能的实时语音对话助手 Skyo,是一个“具备情感表达能力、快速响应能力、多语言流畅切换”的智能语音对话工具。

天工大模型 4.0 o1 版 / 4o 版上线,App 及网页可免费使用

AI在线从官方获悉,Skywork o1 具备三阶段自研训练方案:

推理反思能力训练:Skywork o1 通过自研的多智能体体系构造高质量的分步思考,反思和验证数据。通过高质量的、多样性的长思考数据对基座模型进行继续预训练和监督微调。此外,我们在版本迭代中通过大规模使用自蒸馏和拒绝采样,显著提升了模型的训练效率和逻辑推理能力。

推理能力强化学习:Skywork o1 团队研发了最新的适配分步推理强化的 Skywork o1 Process Reward Model(PRM)。实验证明 Skywork-PRM 可有效地捕捉到复杂推理任务中间步骤和思考步骤对最终答案的影响。结合自研分步推理强化算法进一步加强模型推理和思考能力。

推理 planning:基于天工自研的 Q * 线上推理算法配合模型在线思考,并寻找最佳推理路径。这也是全球首次将 Q * 算法实现和公开。Q * 算法落地也大大提升了模型线上推理能力。

相关阅读:

  • 《昆仑万维推出“天工大模型 4.0”4o 版及实时语音助手 Skyo,号称可克服大模型幻觉》

  • 《昆仑万维“天工大模型 4.0”o1 版启动邀测,具备中文逻辑推理能力》

相关资讯

首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

在「天工」大模型发布一周年之际,昆仑万维重磅宣布,「天工 3.0」基座大模型与「天工 SkyMusic」音乐大模型正式开启公测。自从 AI 让人类实现音乐创作自由后,连吵架都变得有趣了起来。前段时间,X 平台知名 AI 博主 Aran Komatsuzaki 自己写了一首歌,专门用来表达对另一位 AI 科学家 ——Gary Marcus 的不满,还用当前大火的 Suno 把它生成了出来。要知道,过去,这些大佬们的口水战主要就是发个帖子,然后你来我往地跟帖。这次,Aran Komatsuzaki 的做法可谓是玩出了新

昆仑万维:国内首款具备中文逻辑推理能力 o1 模型“天工大模型 4.0 O1 版”11 月 27 日启动邀测

据昆仑万维官方介绍,天工大模型 4.0 O1 版是国内第一款具有中文逻辑推理能力的 o1 模型,其在模型输出上支持思考、计划、反思等能力。

昆仑万维“天工大模型 4.0”o1 版启动邀测,具备中文逻辑推理能力

官方表示,不同于现有的复现OpenAI o1模型的工作,Skywork o1不仅在模型输出上内生了思考、计划、反思等能力,在标准评测集上对比普通模型推理能力大幅上升,让模型拥有了思考和反思带来的推理能力的提升。