AI大模型教程
一起来学习

从Turtor Copilot探讨AI在教育领域的落地

技术的车轮滚滚向前,但用户的需求却相对稳定。不管是初创公司还是大厂,如果在新技术范式吹起来的这股风停下来之前,没能及时找到有希望的落地方向(能满足用户真实需求+有市场机会),风一停,就会跌落进泥土里,消失在空中;而如果落地应用难做起来的话,那些想在淘金热里靠卖铲子赚钱的业务,也不过是短暂的捞快钱,终将随之枯萎。

我的草稿箱中一直有一篇关于LLM产品落地的文章,躺了很久,但迟迟成不出稿,因为确实很难写好。一方面如果是简单罗列各种LLM赋能的场景,容易显得杂碎和混乱,且当中很多应用都是锦上添花,非核心;另一方面,少数已经取得落地突破的,由于涉及商业机密,实际业务数据细节能在公开渠道披露的也极其有限。不过基本可以判断,LLM的优势应用领域大概率是知识密集型且专家资源受限的领域,如教育、医疗、法律等,因为这些领域由于现实问题复杂多样、或对交付质量要求很高,原有的技术解决得不够好,目前基本还是依靠人类专家,标准化程度不高,LLM即使不能完全取代专家,仍可以通过将标准化程度再提高一些,减少较低端重复的部分工作(如信息预加工),创造出经济效益。

斯坦福《Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise》这篇论文,给我们提供了一个很好的示例–LLM技术如何在实际教育场景中孵化成产品落地。

Tutor CoPilot通过生成辅导者可以立即应用的可操作指导来提高K-12教育的质量,解决辅导者的实际需求,并改善学生的实时学习体验。经2个月测试,实验组学生对数学科目的掌握率高出4个百分点(p

Tutor CoPilot的系统架构如上图所示。Tutor CoPilot直接集成到辅导会话中以支持实时互动。当前设置将Tutor CoPilot嵌入到一个虚拟辅导平台中,该平台具有问题显示、共享白板和聊天窗口。新增了一个Tutor CoPilot按钮,允许辅导员在会话中轻松激活它,以获得实时辅助,无缝融入工作流程。

一旦激活,Tutor CoPilot会从正在进行的互动中提取相关信息,例如对话上下文、课程主题和请求的策略。目前,对话上下文基于聊天互动,但系统是灵活的,可以通过处理语音或视觉输入(如白板活动)适应面对面辅导。为确保用户安全和隐私,我们使用Edu-ConvoKit(Wang和Demszky,2024)自动从名册数据库中检索的学生和辅导员姓名进行去标识化处理,使用占位符“[STUDENT]”和“[TUTOR]”。此外,在使用外部LM服务(如OpenAI)时,限制共享的对话上下文为最近的10条消息,以最小化数据暴露。

根据去标识化的对话、课程主题和选择的策略(例如,“提供提示”)生成类似专家的建议。这种方法减轻了辅导员的认知负担,避免自己去想如何提示激发模型,而更专注于提供高质量的指导。

辅导员可以通过编辑建议、重新生成或选择不同的策略来个性化生成的指导。可用策略包括提供解决方案、工作示例、小修正、类似问题、简化问题、肯定正确答案和鼓励学生(如表1所示)。选择新策略会更新响应框中的建议。与通常只提供单一响应的自动完成系统不同,Tutor CoPilot根据不同的策略提供多种建议,以保持质量,同时在有效解决学生需求时保持辅导员的自主权。

由于本文侧重产品和应用,最有代表性的内容已经介绍完毕,关于论文中其他部分,如实验设计和效果评估等,感兴趣的读者可以从附录链接去细读,这里不再赘述。

我们接下来主要以Tutor Copilot为引子,继续探讨LLM在教育领域可以有哪些落地应用以及其中的难点。

根据结构化思维,我们划分为学习前-学习中-学习后三个阶段,分别讨论。

1、学习前

1.1 获客

主要侧重于各渠道推广和获客。当前各家广告平台都在支持生成式AI提高物料投放效率,降低广告主投放物料的生产成本,如广告文案、创意素材生成等,但这种提效本质不会给广告主带来太多收入,因为大家都能用,没有实际门槛和竞争力。 

1.2 转化

线上投放物料后,一般会带有咨询入口,用户通过各种渠道进入这个咨询入口,是全链路中非常关键的一环,因为这个环节直接跟企业的收入挂钩。可通过LLM能力实现智能客服/销售的对话功能,提高线索的转化效率。

这其实就是领域Agent的应用。好一点的企业会将领域知识(公司、产品、服务等)、销售话术、各种情况下的SOP等,都沉淀为数字资产,流程标准化然后用于培训人来做,保证了人工作质量的下限。但随着领域知识的更新、人员的更替,培训人适应新工作内容的过程仍然是不低的成本。而让Agent来替换掉大量基础客服/销售,就可以将精力更多放在如何将金牌销售脑子中的那些“套路”总结并形式化建模出来,让Agent也具备这样的能力,不断优化提高服务质量的下限,从而提高转化效率(24小时实时响应+高效转化漏斗)。

2、学习中

上面介绍的斯坦福的Tutor Copilot就是作用在“学习中”这一环节。论文已经用比较严谨的因果分析证明了Tutor Copilot对教育质量的提升是明显有帮助的。

这一环节是最重要的没有之一,毕竟用户花钱了最关注学习效果,效果不行别的直接一票否决。

而教培行业,最核心的资源就是好的讲师。因为好的老师经过多年实践磨练,会根据不同学生容易犯的错误、学习风格、学习目标和互动反应,调整自己的指导/教学策略,所以教学效果会很显著。而他们不少套路,是在市面上的教材、教辅里面找不到的,自然也就很难通过学生的自学领悟。正因为现实情况复杂,因此教育领域好老师在哪,资源就在哪,反之亦然。真正靠机器自动化,是非常难的,但一旦做出来了,也是颠覆性的。

我们不妨想想除了除了Copilot人机辅助的方式,如果要做教育的Agent,甚至是智能教师,技术上可以怎么做,这是块硬骨头。我们从讲题这个应用切入,思路不难想到,就是对比好的老师与不好的老师相比都有什么特点,然后把这些特点形式化建模出来,让LLM具备类似的能力。

最基本的,我们把题解过程作为COT,引导模型思考,并产生正确答案。

不妨看好未来的MathGPT的一个示例:

如果能实现这个功能,那基本已经能替换掉市面上大部分初级段位的老师了,因为很多水平一般的老师讲题时也是基本照着答案念。当然,这种老师教学效果不会太好,因为念答案不仅容易让人走神,也没有额外信息赠益,跟学生看教辅题解自学差不多。

小编高中物理老师教的几个班,物理成绩稳居年级前列。有一说一,教得确实好,基本上是每个学生早上没睡醒听她两节课都能直接清醒起来,节奏非常紧凑,内容强度也大,听她一节课效率高过自学好几天,听完作业基本都会做,不用背题,考试也能举一反三,直到今天都让我印象深刻。所以我以她为原型,再抽象出几个可以建模进Agent能力的点,技术上不一定好实现,但如果让我来做的话,我会考虑从这几个角度提高Agent的教学效果。

(1)含金量超高的结构化知识笔记,不废话高度简化,不少笔记点本身就是一道典型题,重点易错部分还会标红强调(不仅是后台知识库,还需要有产品功能将知识网络在恰当的时机让学生能看到);

(2)典型题变形,强化印象,再归纳对比异同(题目和知识点之间的知识网络);

(3)金句段子加强易错点记忆。对于学生常见典型错误,即使学生当下没犯,她也会及时点出来,说明原因并通过一些金句加强学生记忆。如当时受力分析场景,她就有句名言“A对B做什么,B就要对A做什么”,让学生及时把相互作用力标上,避免后面忘记;

(4)及时总结小妙招。市面上的教辅为了严谨性,很多解法都中规中矩,但对于一些选择题和判断题,真按教辅的思路去解黄花菜都凉了,厉害的老师会总结出一些快速判断的小技巧,让学生的解题速度有质的提升,避免后面的应用题没时间完成;

(5)结合学生个性化信息,包括历史易犯错误等,让Agent的指导更有针对性。

3、学习后

这部分更多是对公司而言如何持续提高自己的服务质量。

包括学生前后对比报告智能总结,后续续费继续学习的引导话术,以及老带新等策略;

另一方面是根据学生学习过程中发现的问题,数据闭环,迭代老师的教学策略和Agent的反馈更新。

后话

虽说国家已经打压了K12课外培训机构,但若技术和商业的探索不会让阶级固化,应该还是值得鼓励的。借助技术标准化带来的低边际成本,完全可以将优质的教学服务下沉到三四线城市甚至边远山区,让更多的孩子享受到更好更公平的教育。一边是少数家庭才能承担的有限且昂贵的优质教学资源,另一边是客单价较低但拥有更大的用户基数,后者可能赚钱上会更辛苦些,但想象空间还是很大的,不论是ToB(学校/机构合作,用于辅助培训新老师或辅导学生)还是ToC(学生或家长,app/网站/功能内置到各种智能硬件如学习机中)的模式。

附录

论文链接:https://arxiv.org/pdf/2410.03017

欢迎微信扫码关注nlp之路,发送LLM领取奖品~

文章来源于互联网:从Turtor Copilot探讨AI在教育领域的落地

相关推荐: 2、Stable Diffusion

2、Stable Diffusion Stable Diffusion 是一种高效的文本到图像生成模型,它利用扩散模型(Diffusion Model)技术将自然语言描述转换为高质量的图像。其工作原理是通过反向扩散过程,逐渐将噪声引导到符合输入文本描述的图像上…

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » 从Turtor Copilot探讨AI在教育领域的落地
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们