网易有道推出国内首个输出分步式讲解的推理模型“子曰-o1”

据官方介绍,子曰-o1 是 14B 轻量级单模型,支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。
感谢网易有道今日宣布推出国内首个输出分步式讲解的推理模型“子曰-o1”,并正式开源。

网易有道推出国内首个输出分步式讲解的推理模型“子曰-o1”

据官方介绍,子曰-o1 是 14B 轻量级单模型,支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。

网易表示,目前可供应用的开源模型不多,且参数规模较大,无法在低显存的消费级显卡上运行,即使是采用了低比特量化技术,使其能够在单卡上部署,但相应也为长思维链的运行带来了不稳定性。

为此,子曰-o1 开源模型选择了较小参数规模的基础模型,能够进行单卡部署并具备更强的数学能力,并进一步实现了轻量化,能够在消费级显卡上运行,提供与云端部署质量相媲美的模型质量。

图片

网易表示,在规模“压缩”的同时,子曰-o1 采用思维链技术,打造了国内首个输出分步式讲题的思维链模型,以 14B 小参数规模可复现 OpenAI o1 的单模型推理能力,AI在线附演示图:

图片

相关资讯

持续领跑教育科技,有道再发「子曰」教育大模型全新应用

打出“原生应用+业务赋能” 组合拳,“子曰”落地应用全面升级

OpenAI 终于发布 GPT-4o mini,但比中国大模型晚了半年

美国时间 7 月18 日,OpenAI 正式发布了多模态小模型 GPT-4o mini,在海内外引起了广泛关注。 此前,OpenAI 凭借 GPT-3 开拓了 AI 模型的“暴力美学”时代,同时也以训练超大参数规模的模型能力建立起 AGI 同赛道的护城河。 但在其推出 GPT-4o 的“Mini”版本之后,OpenAI 似乎走向了原有优势的反方向,开始卷“小模型”,而值得注意的是:在 Mini 这条路上,欧洲与中国的大模型团队已经率先研究了大半年。

一夜小模型王座易主!英伟达发布超强小模型,新混合架构威力超Transformer,性能、速率、缓存全面超越Llama3.2!

编辑 |言征小模型王座一夜易主了! 冷不防,英伟达就丢出了一个新混合架构,以后不再只是Transformer的天下了。 日前,NVIDIA刚刚发布了Hymba-1.5B-Base,这是一个将Transformer注意力机制与状态空间模型(SSM)集成的小型语言模型。