让大模型给儿童当全科家教,靠谱吗?
指点儿童功课,是每一位家长注定要经历的「修行」。
「为什么一道题讲几遍还是不会做?」
「我是本科学历,本来以为不妨自己在家指点儿童,没成想才初一课程就碰了钉子。」
相信大家对这些话的语境一定很熟悉。在打工一整天之后,再拖着疲惫的身躯亲自指点作业,让很多家长真实地感到头疼。
再加上,随着儿童年级的升高,课程中的常识点越来越丰富,家长指点儿童功课也越来越吃力。有些简单的题目,家长们还可以指点一二,但谈到「全科指点」,很多家长对常识的明白也并不充分,未必能很好地为儿童答疑解惑。
其实,面对这个难题,家长们不妨寻找外力的帮助。
就在这两天,大家应该已经听说了,教训领域出现了一位新晋的明星家教 ——「小 P 教员」。
「小 P 教员」不是真人,它是一位不妨进行全科答疑的「AI 家庭教师」。据说,从小学到高中全学段的语数英物化生等 10 科的各类题型,没有「小 P 教员」答不出来的。
最可贵的是,即使是那种涉及多步骤推理、明白起来难度比较大的数理化难题,「小 P 教员」也不妨耐心地层层引导式讲解。就这一点来说,确实比大多数家长的心态强大……
儿童们可以给「小 P 教员」发文字、语音、图片发问,就像与真人家教线上聊微信一样自然,而且比真人回复更及时,还 24 小时在线。
问题来了,怎么联系「小 P 教员」?初步了解之后,我们知道「小 P 教员」的「驻地」是最新发布的有道 AI 进修机 X20,它的超级教授教养威力则源于「子曰教训大模型 2.0」。
有道 AI 进修机 X20
「小 P 教员」也是子曰教训大模型全新升级后的首个落地应用成果。相比于初代版本,有道的子曰教训大模型目前已在口语对话、教训场景常识问答、文字处理等多项威力上有了大幅提升。
那么,「小 P 教员」在教授教养中的表现具体如何?能否担得起「AI 全科教师」的称号?
机器之心第一时间体验了有道 AI 进修机 X20,从多个维度进行了一番考察。
一对一,「小 P 教员」讲题水平如何?
一上来,我就让「小 P 教员」给我讲了道题。「一对一讲题」也是大部分家长最关心的一环,关系到儿童能不能听明白、学得投不投入、成绩能不能有效提升。
每个儿童进修的方式和思维盲点并不相同,统一的课堂教授教养并不能匹配每个人的进度。因此,儿童们最需要的不是进修资料,而是一个懂得因材施教的教员。也正是基于这一点,家长们亲自下场指点或聘请一对一家教,有针对性地给儿童补课。
现在,「小 P 教员」或许可以担任这一角色:基于大模型的多轮交互威力,「小 P 教员」每次可以支持多达 8 轮对话,儿童有什么不懂的都可以问。而且面对发问,「小 P 教员」不只是给出一份简略的标准答案,还不妨供应常识点解析、思路逐步拆解和举一反三等个性化讲题服务。
我们可以拿一道数学应用题试试:
此处,「小 P 教员」采取了发问启发式教授教养,目的是激发儿童的思考和主动性。首先提示儿童这是一道「周期性重复」类型的问题,然后给出了拆解信息的思路和方法:先确定一个周期内有多少颗珠子,再计算第 600 颗珠子落在哪个周期,以此确定这颗珠子在周期中的位置。
如果儿童暂时没明白也没关系,「小 P 教员」会进一步告知解题方法:
依照方法解题之后,「小 P 教员」会帮忙验证答案,还会帮助确认一遍思考历程:
最后,面对学生对「周期性重复问题」的好奇心,「小 P 教员」还能介绍背景常识,并进行要点总结。
在与「小 P 教员」的个性化教授教养互动历程中,儿童的进修效果得到了最大化提升。这个历程中,我们也能感受到「小 P 教员」和其他对话式大模型的风格差异,它更懂青少年进修常识和认知威力发展的历程,愿意用一种浅显易懂的语言去和儿童「沟通」解题思路。
以往,AI 技术在课程指点层面的应用大多仅基于规则与常识点供应自适应进修,而生成式大模型带来了意图明白、自然语言交流层面的突破,有望实现真正的「因材施教」。
一方面,大模型不妨更好地明白开放式对话。比如在发问的历程中,儿童的表达可能并不那么清晰,以前的 AI 可能很难明白这类开放性表达,但如今的大模型有威力准确明白青少年在进修历程中的不完整表述,并将获得的信息与常识文档中的内容相匹配,给出有针对性的回复。
另一方面,伴随着上下文窗口技术的突破,大模型可以更全面地明白上下文、处理更复杂的任务和需求。在与儿童的互动中,子曰教训大模型 2.0 更长的上下文窗口帮助了「小 P 教员」更好地处理对话的上下文信息,生成更加连贯、准确、全面的回答。
晦涩难懂的《离骚》,「小 P 教员」竟然让我读明白了
我们知道,对于习惯了现代汉语体系的儿童来说,往往难以充分明白古代作品,解答文言文题目的历程也必然存在很多难点:断句问题、古代文化常识背景、通假字的迷惑性、翻译技巧等等。
曾有研究者面向多个大模型做过测评,其中古汉语是最具挑战性的任务之一。古汉语虽然难懂,但对于原本就擅长「语言」的大模型来说并非不可解的难题。具体来说,引入高质量的专有数据集,通过监督微调对基础语言模型进行定制化训练,再借助人类反馈强化进修的方法改进,就可以快速弥补模型在古代汉语上的威力不足。
「小 P 教员」的优点是不仅可将其翻译为现代汉语,还能供应文化背景常识的讲解和常识点剖析。
都说「痛饮酒,熟读《离骚》,便可称名士」,但这篇来自先秦时期的抒情长诗实在太难懂,我就让「小 P 教员」帮忙解读了一下:
不只是古文,面对任何的长文本内容,大模型的明白威力都比一般的人类教师还要强大。这是因为大模型擅长明白和处理长篇文本、大规模数据集或大型常识库。即使教材内容不断更新,所涉及的背景常识有所变化,大模型也能做到持续进修。
多模态输出发问,能不能行?
众所周知,各个科目的题目形式是非常多样的,比如数学题有公式和几何形状,物理题有受力分析图,化学题有分子结构等等,这要求「AI 家庭教师」需要拥有和人类教师一样的多模态内容鉴别威力。
这一年来,大模型技术已经取得了在多模态任务上的多项突破,但现实场景中的多模态鉴别还存在很多形式的挑战,比如文字不一定会以规范的印刷体的出现,输出图片的「形变」和「阴影」等因素也都会加大鉴别和明白的难度。又比如,不同学科的试题都可能出现「多图象交织对话」,模型需要比较多个输出图象和明白与图象相关的问题,以此为依据生成答案和讲解。
「小 P 教员」的一大亮点就是支持全输出场景鉴别,包括用文本、图片、音频等多种形式输出发问。
比如,把一张模糊的拍摄图发给「小 P 教员」,都不用补充发问,它即刻就能分析出题目的含义与解答思路。
这一功能源于「子曰教训大模型 2.0」在多模态威力上的进步。尤其是对于涉及复杂图文输出的任务,「小 P 教员」的表现同样优秀。
大模型之所以能展现出强大的图文明白威力,与自身的多模态上下文进修(in-context learning)威力密切相关。与传统的视觉推理模型相比,多模态大模型在大规模的预训练历程中已经进修到丰富的开放世界常识,不妨在零样本或少样本的情况下推广到未见过的对象或概念。具体来说,只要在训练历程中给出几个图象 – 文本对作为示例,大模型就能将任务转移到未见过的问题上。
比如面对包含图象的数理化试题,「小 P 教员」不仅可以鉴别图象中的文字,还能精准捕捉图象与文字之间的语义关联。
如此看来,家长们终于可以解放了。当然,有了全能的「小 P 教员」之后,我们不建议家长们对儿童的进修完全放手,毕竟这也是拉近亲子关系的重要一环(狗头)。
AI 接手全科教授教养的时代,这就来了吗?
至此,我们已经基本了解「小 P 教员」的教授教养功底。不过,儿童的进修历程中还有一项艰难挑战:「全科课程指点」。
任何 AI 解决方案想要在教训领域更好落地,发展全科认知威力是一个必须突破的关键点。「AI 全科家教」必须拥有海量的常识储备且融会贯通,才不妨应对各学科的问题。
今年以来,GPT-4 率先证明了大模型不妨掌握多学科常识,并在律师资格、SAT 以及 GRE 等各种考试中均取得了不俗的成绩。如今,我们知道这种「全能」不仅能用来通过考试,还可以在教训领域发挥巨大作用。就像「小 P 教员」,针对中小学阶段的任何学科,都可以为学生供应个性化的进修支持、回答问题,并供应解释和指导。
不管是 GPT-4 还是「小 P 教员」,之所以不妨胜任全科任务,本质上都和大模型「擅长进修常识」的特性分不开。
人类的认知受限于生物智能的本质,导致认知威力总归存在天花板。对于普通人来说,不妨精通某一个领域的教授教养已经非常不容易。大模型却是一个相当巨大的常识容器,可以对海量的多学科常识进行提炼、吸收,获得非常强大的认知威力,至少可以在中小学课程教授教养这个领域成为「通才」。
在让大模型获得「通用性」这件事上,目前已有一些行之有效的方法:一种是利用指定的数据集对大模型进行微调,短时间内就拿下全科威力;还有一种近来比较流行的方法,利用 RAG(检索增强生成)技术和专有数据源的信息来补充文本生成,就能让大模型快速吸收外挂常识库,保持常识的更新迭代。
往前想一步,大模型的这种通用威力,同时使其有资格担任教授教养中类似人类教师的「打分」角色。只要写出规范的评价标准,以及逐步评价的历程,大模型就能迅速适应评估流程,帮助儿童纠错,养成更好的思维方式。
长远来看,大模型技术加持下的「AI 全科家教」,一定会给教训行业带来深刻的变化。
话说回来,进修机毕竟是一款电子产品,家长们同样要从硬件角度来考量。有道 AI 进修机 X20 也从各个方面下了功夫:为了模拟纸质资料的进修体验,X20 采用了定制墨水模式搭配高清雾镀护眼屏,叠加了六种护眼功能。X20 还配备了 4096 级压感智能书写笔,在儿童沉浸式做题的历程中全面呵护儿童视力。
X20 还首创了「三合一」模式,不仅是进修机,还是学练机,更是儿童的专属电脑。在学练机模式下,X20 供应了《5.3》战略合作资源,内置海量正版中高考同源试题可供选择;在电脑模式下,可使用原装专研智控键盘和内置键盘输出练习软件,规范打字指法。
在「小 P 教员」之外,新一代虚拟人口语私教 Hi Echo 同样是 X20 内置的一款大模型原生应用,并已完成了虚拟人形象、场景、对话威力、教授教养模式的全面升级:Hi Echo 2.0 版本新增了「口语定级」功能,并有新的虚拟人形象可供用户灵活选择。此外,考虑到学生的进修进度和英语威力,Hi Echo 2.0 设计了更多元化和深入对话场景的练习。同时,基于「子曰教训大模型」的技术支持,有道 AI 进修机 X20 还供应了全题型语法精讲,包括阅读明白、作文批改等功能。
写在最后
在大模型风起云涌的这一年,曾有多位研究者指出,教训领域是大模型落地的绝佳场景之一。
现在,我们已经从「小 P 教员」身上看到了大模型落地教训领域的未来形态。
在教授教养流程上,它改变了「单纯分发进修资源」的传统方式,供应了一种通过讨论、问答引导儿童培养自主进修威力的途径,还能根据发问「对症下药」,有针对性地推送相关常识,实现了从「千人一面」到「千人千面」的跨越,而这正是我们千百年来追求的教训理念。
在教授教养模式上,由于大模型有着强大的常识迁移和组合创新威力,不妨针对不同的学科、技能实现融会贯通、举一反三,使得 AI 与教训的结合不再只限于某一个学科和环节。通用大模型涌现出的泛化威力和生成威力,大幅降低了教授教养工作所需的人力成本,也会催生出全新的教训形态。
与此同时,我们可以看到,生成式大模型还在更多领域不断取得突破,比如文生图、文 / 图生视频、文 / 图生 3D 等方向。这些新技术同样有望融合到「AI 家庭教师」的威力之中,衍生出新的多模态交方式,使 AI 在教训领域的应用场景更加多元,发挥更多的价值。
伴随着生成式 AI 技术的持续进步,一场教训范式的全面革新必将发生。