阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview

阶跃星辰昨日(1 月 16 日)宣布,自研推理模型 Step Reasoner mini(简称 Step R-mini )上线。
感谢阶跃星辰昨日(1 月 16 日)宣布,自研推理模型 Step Reasoner mini(简称 Step R-mini )上线。

官方表示,在 AIME 和 Math 等数学基准测试上,Step Reasoner mini 的成绩超过了 o1-preview,比肩 OpenAI o1-mini。在 LiveCodeBench 代码任务上,也比 o1-preview 效果更佳。

阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview

Step Reasoner mini 通过大规模的强化学习训练,并使用 On-Policy(同策略)强化学习算法,实现了“文理兼修”。Step Reasoner mini 除了能准确解答数学、代码、逻辑推理问题,还能富有创意地完成文学内容创作和日常聊天的任务。

阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview

AI在线附体验链接:https://yuewen.cn

阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview

相关资讯

钟南山团队、腾讯联合研究:AI模型评估这三项措施最有助于防控疫情

关闭学校、关闭工作场所、取消公共活动、限制人群聚集、公共交通管制、居家生活建议、限制国内流动、限制国际旅行…… 到底哪项政策防疫效果更好?钟南山团队与腾讯的联合研究发现了其中的 Top 3。

参数量仅 0.25B,成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型

在视频演示中,人形机器人在不断被干扰的情况下,依然能够将目标物体摆放到指定位置,展现了 R-DDIRM 模型在复杂环境中处理各种任务的能力。

智谱版o1终于也来了:直接拿下考研数学,一句话就能做小游戏!

终于,在2024年的最后一天,智谱版o1也来了! 名字叫做GLM-Zero-Preview,Zero推理模型(下文简称Zero模型),自称是擅长通过逻辑推理来解决数理问题。 既然如此,那么我们就直接一套2024年考研数学真题来伺候一下吧~规则也很简单,就是把真题的题目以截图的方式“喂”给Zero模型,这样也可以顺便考验一下它的视觉理解能力。