有道发布“子曰”教育大模型,口语老师将成为历史?

有道系统性阐述了其对于大模型与教育结合的目的、方式和想象力。

7月26日,网易有道举办了“powered by 子曰”教育大模型应用成果发布会。推出了国内首个教育领域垂直大模型“子曰”,并发布了基于“子曰”大模型研发的六大创新应用——“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”以及“文档问答”。

在会上,有道系统性阐述了其对于大模型与教育结合的目的、方式和想象力。

逻辑:教育个性化、模型场景化

网易有道CEO周枫在发布会上表示,大模型的出现能给教育带来的最大机会是助力因材施教。其透露,有道教育大模型之所以叫“子曰”,是因为孔子是我国的教育先贤,又是因材施教教育理念的奠基者。“‘夫子教人,各因其材’,我们希望子曰大模型可以朝着这样的教育理想去做。”

从产品细节看,大模型能为学生提供个性化的分析和指导;其次,大模型能够实现引导式学习,与教师一样,提出问题并引导学生自行探索答案;最后,大模型具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容,大模型能随时满足学生的动态需求,帮助孩子培养更综合的能力。

在结合方式上,有道特别强调了“场景”的重要性。据介绍,“子曰”大模型从一开始就定位为一个“场景为先”的教育垂类大模型。它能够作为基座模型支持诸多下游任务,向所有下游场景提供语义理解、知识表达等基础能力。基于此,有道研发团队在“子曰”大模型的基础上,为不同学习场景设计了定制化的模型,以实现模型与场景的高度契合。

“我们的目标很明确,就是以实际的教育场景驱动,用技术创新助力教育创新。”周枫表示,希望技术和产品的深度融合,可以根据学⽣不同能⼒和需求,提供因人而异的个性化教学。

产品:口语教练取代口语老师?

基于这样的逻辑,在发布会上,有道展示了“子曰”大模型在多个场景中的应用成果,覆盖口语训练、作文批改、习题答疑等六大教育的细分领域。

其中,发布会现场,有道展示了英语口语练习神器——虚拟人口语教练Hi Echo。有道词典业务负责人与Echo进行了多组随机对话。Echo能迅速理解场景和上下文,并给出迅速反馈。在对话过程中,Echo能够像真人老师一样循循善诱,启发式进行对话引导,还能进行实时反馈。对话结束后,Echo会从发音、语法等维度给予建议和润色,能有效解决长期困扰英语口语学习者无话可说、不知从何说起、害怕说错等问题。

有道词典业务负责人对蓝鲸财经表示,口语教练不单单是虚拟人加大模型,其背后有复杂的逻辑。需要像老师一样循循善诱。为此,有道针对口语做了诸多细致入微的工作,包括语音识别技术、语音合成技术,使得AI口语教练能够像真人一样,模拟真人的发音状态,识别中国用户习惯化的表达,提供完整的体验。此外,在面部表情、嘴型准确度、发音流畅度等方面,有道也做了相应地努力,力求呈现更理想的对话效果。

对于能否取代“口语对话老师”的提问,有道并未给出直接答案。周枫透露,未来口语教练有望实现商业化,以极低的价格开展会员付费。

除了口语,有道还展示了大模型赋能的“语法精讲”功能。通过为学生提供针对性的解题思路和方法,还能推荐同类型的考题,帮助学生触类旁通,真正理解考纲中的考点。

此外,有道在发布会上推出的“AI作文指导”应用不仅具备“作文批改”功能,还具备“作文指导”功能。据介绍,该应用旨在解决“学生不会写”和“老师没时间改”的问题。针对学生在写作、前、中后过程中面临的题目主旨难确定、写作素材匮乏等难题,该应用都能够给予指导,帮助学生“下笔如有神”。批改环节中,AI作文指导还会从表达、结构、内容深度、情感丰富度四大维度全面提供改进建议。

整体来看,有道对于大模型与教育的结合方式,坚持的正是“场景拉动”。利用大模型的力量,在教育领域打造诸如虚拟人口语教练、语法精讲、AI 写作指导等丰富的解决方案,为用户提供了更加个性化和高效的学习体验。

场景拉动,有道技术坚持技术路径?

值得注意的是,随着“子曰”大模型的推出,大模型在教育领域正式进入了应用阶段,有道也因此成为率先将AIGC技术落地到教育场景内的企业。多年来,有道始终在力推技术赋能教育的路径。“双减”后,这条路径逐渐提速。

2008年,有道就推出自主研发的国内首家统计机器翻译线上引擎。经过15年技术迭代,有道神经网络翻译(NMT)已经进化成行业领先的“最强大脑”。根据QUESTMOBILE最新数据,到目前有道词典月活用户已经超过1亿,是国内词典翻译市场的第一名。

从2016年开始,有道协同构建AI基础能力,同步组建语言、视觉、声音等团队,目前积累了有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算(HPC)四大底层技术能力。

2017年,有道将AI能力统一在大模型之下,并尤其重视在端侧的落地应用。有道词典笔2代2019年首次搭载离线Transformer NMT。2022年,有道词典笔P5中搭载了自研的离线ASR,也已升级为Transformer技术。

底层技术不断革新的同时,有道还在不断研发细分场景下的技术应用。如虚拟人口语教练实现语音识别能力、虚拟人驱动技术和内容生成和对话能力等。本次展示的虚拟人口语教练Hi Echo就是得益于语音识别能力方面的革新。

周枫对蓝鲸财经表示,当前的大模型可以类比为移动互联网,应用和场景是变革的中间环节,是需要及早抓住的机遇。在当下大模型浪潮中,有道正在凭借着底层的技术积累,探索与教育场景结合的可能性,并走出一条垂直大模型的通路。