面向环球数学爱好者和科研机构,计划于年内推出
据了解,学而思正在进行自研数学大模型的研发,命名为MathGPT,面向环球数学爱好者和科研机构,以数学范畴的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出鉴于该自研大模型的产物级应用。
据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在环球范围内招募优秀的人工智能专家加入。
MathGPT与大说话模型(LLM)的差异
美国OpenAI公司在今年三月份发布了大说话模型GPT-4,国内百度、阿里也发布了各自的大模型产物,但通用说话模型更像一个“文科生”,在说话翻译、摘要、理解和生成等任务上有出色施展阐发,在数学题目的解决、讲解、问答和推荐方面则存在明显不足:解答数学题目经常出错,有些数学题目虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。
“这种不足是由LLM模型的自身特点决定的。”学而思AI团队负责人介绍,LLM大模型来自对海量说话文本的训练,因此最擅长说话处理。行业内偏向鉴于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。因此,学而思决心组建团队专研MathGPT——数学范畴大模型,用自己在数学和AI上的多年积累,面向环球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。
学而思希望通过MathGPT弥补和攻克大说话模型的三个题目:第一,题目要解对,现在GPT结果经常出现错误;第二,解题步骤要稳定、模糊,现在GPT的解题步骤每次都不一样,而且生成内容经常很冗余;第三,解题要讲的有趣、个性化,现在GPT的解释过于“学术”和机械,对孩子的进修体验很不友好。
做MathGPT,学而思凭什么
学而思作为获国家科技部批准的“智慧教育国家新一代人工智能开放立异平台”建设单位,也是教育行业唯一一家人工智能“国家队”成员,在人工智能范畴有着多年的深入研究,早在2017年,学而思便成立了AI lab 人工智能实验室。
据公开信息显示,鉴于智慧教育人工智能开放立异平台助力,学而思AI lab获得各类顶级学术会议比赛冠军16项,亚军6项;发表国际期刊和会议高水平学术论文31篇,包含光学字符识别、图像、自然说话处理、语音以及多模态等多范畴的学术研究,在计算机视觉顶会以及自然说话顶会中均有多篇论文发表;申请专利220余项,授权专利150余项,软件著作权60余项。
学而思AI lab在各类顶级学术会议比赛获奖情况
“以数学起家”的学而思至今已有20年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行MathGPT训练的必备物料。另外,学而思的海外业务Think Academy在环球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的IMO和AMC等国际数学竞赛中施展阐发优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。所以,学而思选择在MathGPT方向发力也顺理成章。
另据了解,学而思进修机近期将会上线一款“AI帮忙”,涵盖作文帮忙、口语帮忙、阅读帮忙、数学帮忙等相关功能,该AI产物将于5月11日开启内测。
MathGPT的挑战和技术难题
如何利用大说话模型服务各行各业是当下社会的焦点题目。比如在教育范畴,Duolingo、Quizlet、可汗学院等产物主要和OpenAI合作,在GPT大模型上做微调和接口调用,增强原有的产物体验。但也有一些范畴如数学、医学等,对AI的需求是准确、模糊、具备强大的逻辑推理能力,且容错率低,通用LLM目前的性能施展阐发还无法在上述范畴取得突破,未来是不是可能取得突破尚不模糊。
以数学范畴为例,目前市场上有几个主要流派。比如Google收购的Photomath、微软数学、Mathway、专注数学计算的WolframAlpha等产物,主要利用非LLM的传统AI技术加上数据库的方式解决数学题目。走AGI路线的公司则尝试让通用LLM“更懂数学”,比如GPT4在数学任务上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也专门针对数学题目进行调优。学而思选择了另一条少有人走的路,不鉴于现有LLM做微调和接口调用、不做通用LLM,而是自研鉴于专业范畴的“数学大模型”MathGPT,致力于打造自主、稳定、可持续、高质量的进修解决方案。
在大说话模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。学而思自研独立的MathGPT大模型是不是成立,是不是能够超越通用模型在数学任务上的施展阐发,是不是更匹配不同人群的数学进修场景,这个题目还需要在立异实践中寻找答案。随着整个行业的深化发展和越来越多人才参与到这个范畴,相信不久的将来就能看到更为成熟的解决方案。