[发明专利]课堂话语类型分类方法及装置在审
申请号: | 201910069620.3 | 申请日: | 2019-01-24 |
公开(公告)号: | CN109800309A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 何秀玲;陈增照;吴珂;罗青刚;刘桂麟;张婧;朱淑培;汪瑶燕;杨凡;杨泞瑜;喻千帆 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G10L15/26 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 郭俊霞 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签文本 分类 标签类型 课堂 预设 话语 转录 分类模型 话语类型 音频数据 教育教学 人工分类 数据包括 文本数据 自动分类 最小单位 集合 研究 分析 | ||
本发明提供一种课堂话语类型分类方法及装置,涉及教育教学技术领域。该方法包括:获取课堂中的音频数据,将音频数据转录为待分类的无标签文本数据,无标签文本数据包括多个按照最小单位划分的话语,获取训练好的预期LSTM分类模型,根据预设的标签类型、待分类的无标签文本数据以及训练好的预期LSTM分类模型,得到分类后的有标签文本数据,根据分类后的有标签文本数据,获取预设的标签类型所对应类型的话语集合,能够将课堂中讲述的一些话语转录为相应的文本数据之后,把每句话按照预设的标签类型进行自动分类,从而减少了人工分类时所用的时间和精力等,提高研究人员需要分析或研究课堂中的话语时的效率。
技术领域
本发明涉及教育教学技术领域,具体而言,涉及一种课堂话语类型分类方法及装置。
背景技术
在现代信息技术背景下,对课堂的研究主要是对课堂话语特征的研究,而话语特征的提取主要依据课堂观察法、课堂录像,还停留在人工全权进行判断、分类,最后进一步进行统计。
因此,当面对海量的教育大数据时,将会花费大量时间与精力在数据处理上,人为分类将耗时耗力。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种课堂话语类型分类方法及装置,以解决面对海量的教育大数据时,将会花费大量时间与精力在数据处理上,人为分类将耗时耗力的问题。
为实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种课堂话语类型分类方法,所述方法包括:获取课堂中的音频数据,将所述音频数据转录为待分类的无标签文本数据,所述无标签文本数据包括多个按照最小单位划分的话语;获取训练好的预期长短期记忆网络(Long Short-Term Memory,简称LSTM)分类模型,根据预设的标签类型、所述待分类的无标签文本数据以及所述训练好的预期LSTM分类模型,得到分类后的有标签文本数据;根据所述分类后的有标签文本数据,获取所述预设的标签类型所对应类型的话语集合。
一种实现方式中,获取训练好的所述预期LSTM分类模型的步骤,包括:获取各标签类型的文本数据集合中的训练文本数据和测试文本数据;根据所述训练文本数据和所述LSTM分类模型的预设参数进行训练,得到训练后的初始LSTM分类模型;通过所述测试文本数据对所述初始LSTM分类模型进行测试,得到所述测试文本数据分类后各标签类型对应的文本数据;将所述分类后各标签类型对应的文本数据与所述测试文本数据比较,确定所述初始LSTM分类模型的准确率;若所述准确率大于等于预设阈值,则得到训练好的所述预期LSTM分类模型。
一种实现方式中,所述将所述分类后各标签类型对应的文本数据与所述测试文本数据比较,确定所述初始LSTM分类模型的准确率的步骤,包括:判断所述分类后各标签类型对应的文本数据的标签类型与所述测试文本数据的实际标签类型是否一致;若一致,则所述分类后各标签类型对应的文本数据分类正确,若不一致,则所述所述分类后各标签类型对应的文本数据分类错误;计算所述分类后各标签类型对应的文本数据的分类正确率,得到所述初始LSTM分类模型的分类准确率。
一种实现方式中,所述获取各标签类型的文本数据集合中的训练文本数据和测试文本数据的步骤,包括:获取课堂历史音频数据,将所述历史音频数据转录为无标签历史文本数据;将所述无标签历史文本数据按照预设的标签类型进行分类;将分类后属于同一标签类型的历史文本数据汇总得到各标签类型的文本数据集合;根据预设比例获取所述各标签类型的文本数据集合中的训练文本数据和测试文本数据。
一种实现方式中,所述方法还包括:根据所述预设的标签类型所对应类型的话语集合,计算各所述预设的标签类型所对应的话语占据所述话语集合的百分比和/或频数。
一种实现方式中,所述预设的标签类型包括:理解型、应用型、分析型、综合型和评价型中至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910069620.3/2.html,转载请声明来源钻瓜专利网。