8 月 24 日,机器之心获悉,在好将来 20 周年直播活动中,CTO 田密宣布好将来自研的数学规模千亿级大模型 MathGPT 正式上线并开启公测。即日起,用户可通过官网(www.mathgpt.com)申请注册账号免费试用感受。
今年 5 月,好将来曾公布正在进行自研数学大模型的研发,命名为 MathGPT。MathGPT 是面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直规模的大模型,也是国内首个专为数学打造的大模型。
使用体式格局也很简单。用户使用 MathGPT 时,用文字或图片体式格局上传数学题,即可得到对话式的解答反馈,也可以通过 “随机来一题” 的按钮,随机生成数学问题并由系统给出解答。
目前,MathGPT 支持中文、英文版本的 PC 端和移动端感受。
领先的数学解题本领
MathGPT 汇集了好将来多年培养教研数据积存,专注于数学规模。千亿级大模型的训练、推理、部署框架,为模型赋予了强大本领。通过优质培养数据,实现问题计算、讲授、问答等多任务持续训练和有监督微调,呈现出卓越表现。此外,借助人类反馈对齐,还将进一步提升模型综合素养。MathGPT 在解题准确率、稳定性及用户感受方面均有明显的优势。
据了解,MathGPT 的数学计算本领已覆盖小学、初中、高中的数学题,问题类型涵盖计算题、使用题、代数题等多个类型,还可以针对问题进行追问。不过暂未封闭数学之外的问答互动。
MathGPT 手艺报告
具体效果如何呢?在 CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学和 Math401 等 6 个公开数学评测集合的测试结果中,MathGPT 取得了多项测试的最高分数。同时,MathGPT 在 C-Eval 的初高中的全科测试集合上也均有不错的表现。
MathGPT 在 C-Eval 榜单初高中各科成绩
此外,在解题稳定性、讲授友好度方面,MathGPT 鉴于海量名师解题过程的数据进行模型训练,模型的解题步骤专业清晰。
我们以一道数列题为例,MathGPT 给出的谜底包含 “分析”、“详解”、“点睛” 三个部分,比通用大模型的粗略讲授体式格局更为细致。其中“分析” 提供了问题的解题思路、思考体式格局,帮助用户更好地理解问题;“详解” 则给出具体的计算体式格局和谜底;最后 “点睛” 的环节对问题的考点、难点、关键点进行提示,帮助用户回顾反思出题意图、举一反三。
对于使用者而言,研究数学问题不仅在于得到谜底本身,更在于谜底背后的解题原理、思路逻辑。与其他通用大模型相比,MathGPT 能实现更高准确度的解题,也能把谜底解析得更清楚、讲授得更明白,更好地满足用户使用 AI 产品解答数学问题的核心需求。
在 MathGPT 发布同时,好将来也更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者感受和测评。好将来希望让 MathGPT 在数学培养规模发挥更大作用,并愿意把鉴于大规模、高质量的内容的千亿级大模型研发经验方法和业内分享,和行业共同进步。
好将来 AI 的厚积薄发
在 AI 浪潮的推动下,今年以来多家科技公司宣布推出通用大语言模型产品,而好将来选择了另一个方向,不鉴于将现有大语言模型做微调和接口调用、不做通用大语言模型,而是深入数学的垂直规模研发大模型,致力于打造自主、稳定、可持续、高质量的数学解决方案。
通用大模型 “重文轻理”,在数学问题的解决、讲授、问答和推荐方面则存在明显的短板。而在另一个层面,在通往通用人工智能的路上,数学推理本领很重要,全球有很多大型公司在做这方面的研究。
“好将来在数学的数据和业务上有 20 年的积存,有大量的培养数据的积存和持续生产培养数据的本领,所以选择做这个难而正确的事情。” 田密称,好将来希望用自己在数学和 AI 上的多年积存,做好 AI 大模型时代的数学基础工作。
其实早在 2017 年,好将来便成立了 AI lab 人工智能实验室。鉴于智慧培养人工智能封闭创新平台助力,好将来 AI lab 获得各类顶级学术会议比赛冠军 16 项,亚军 6 项,发表国际期刊和会议高水平学术论文近百篇。
2019 年,科技部宣布依托好将来建设智慧培养国家新一代人工智能封闭创新平台,好将来成为培养行业首批唯一一家人工智能 “国家队” 成员,在人工智能规模有多年深入研究。多年来,好将来以培养行业重大需求为牵引,构建了面向培养的人工智能算法本领、使用解决方案、基础软硬件体系和开源封闭服务的国家培养科技创新平台。
好将来也在积极参与推动大模型标准体系建设,先后作为核心单位参与了由国家人工智能标准化总体组组织的大模型系列国家标准、中国信通院牵头编制的 “大模型预训练模型手艺和使用评估方法” 系列团体标准,以及培养部培养信息化手艺标准委员会暨全国信息手艺标准化手艺委员会主导的 “培养通用大模型” 系列标准编制工作。
近期,好将来正作为牵头单位与中国信通院、复旦大学、科大讯飞、百度等行业领先科研机构、高校、企业一同编制培养大模型团体标准,从覆盖场景、使用成效、服务可靠等维度全面评估培养大模型本领,为培养大模型使用落地提供参考与指导。
用 AI 实现大规模因材施教
随着大语言模型的兴起,如何用 AI 手艺服务各行各业是社会关注的焦点。培养行业是最早开始布局 AI 规模的行业之一,AI 能为培养生态带来何种变化一直备受关注。
“AI 带来了重新定义培养行业的机会,大模型手艺使得大规模的因材施教真正有了实现的可能。” 田密介绍,20 年来,好将来一直在探索个性化进修,从线下小班到线上大班,再到 AI 课,形式不断进化,但教的内容始终是固定的、学生和老师互动较少、颗粒度只能到问题级别。
田密认为,大模型的本质,是一种更高效的、从数据中进修知识并加以使用的体式格局。在 AI 本领的加持下,“学生自学 + AI 答疑” 的新型进修体式格局成为广泛的可能。进修者获得优质教学内容的门槛、成本降低,获得的教学内容个性化、精细化程度持续升高,可以实现千人千面的 AI 教学和答疑辅导,每个学生都能得到最适合自己的进修内容。
以 MathGPT 为基础,好将来将不断探索 AI 环境下的进修体式格局,更好地服务于全球的进修者、数学爱好者,并将经验及时与行业分享,通过 AI 手艺助力培养科技的积极改变。
随着公测的顺利进行,MathGPT 的解题本领将得到持续提升,鉴于 MathGPT 的产品级使用也正在加速研发中,将于近期发布。