[发明专利]一种面向在线学习社区的学习兴趣发现方法在审
申请号: | 202010776809.9 | 申请日: | 2020-08-05 |
公开(公告)号: | CN112101039A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 杨宗凯;刘三女牙;刘智;刘石奇;粟柱;赵亮 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/247;G06F40/284;G06F40/289;G06F40/295;G06K9/62;G06Q50/00;G06Q50/20 |
代理公司: | 武汉天力专利事务所 42208 | 代理人: | 吴晓颖 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 在线 学习 社区 兴趣 发现 方法 | ||
本发明涉及计算机技术自然语言处理领域的文本挖掘技术,提供一种面向在线学习社区的学习兴趣发现方法,包括:采集在线学习社区中学习者生成的多维度行为和文本信息;融合领域知识命名实体词和学习情绪词进行文本分词;基于时序‑情绪‑主题的文本建模算法,挖掘与情绪和时序信息相关的兴趣主题概率分布;基于语义相似度计算方法,鉴别学习者的学习兴趣和非学习兴趣;根据应用场景,输出学习兴趣标签及其权重。本发明方法能有效发现学习者的学习兴趣,并显著提高学习兴趣的可解释性和准确性,有助于为学习者提供个性化的学习服务。
技术领域
本发明涉及计算机技术自然语言处理领域的文本挖掘技术,尤其涉及一种面向在线学习社区的基于时序-情绪-主题建模的学习兴趣发现方法。
背景技术
在线学习社区为不同空间和时间的学习者提供了协作学习和知识建构的场所,弥补了网络互动场景下社会情绪和认知交流的缺失。其中,学习者产生的大量非结构化文本信息中蕴藏着大量的学习兴趣信息。
然而,由于学习兴趣作为一个教育心理学的概念,其与领域知识、学习者情绪、时序演化等因素密切相关,常用的点击流日志分析方法和关键词挖掘方法并不能有效地发现和追踪与学习内容相关的兴趣。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种面向在线学习社区的学习兴趣发现方法,用于解决现有学习兴趣发现方法偏离教育心理学理论,无法有效发现学习兴趣的问题。
本发明的目的是通过以下技术措施实现的。
一种面向在线学习社区的学习兴趣发现方法,包括以下步骤:
(1)采集在线学习社区中学习者生成的多维度行为和文本信息;
(2)融合领域知识命名实体词和学习情绪词进行文本分词;
(3)基于时序-情绪-主题的文本建模算法,挖掘与情绪和时序信息相关的兴趣主题概率分布;
(4)基于语义相似度计算方法,鉴别学习者的学习兴趣和非学习兴趣;
(5)根据应用场景,输出学习兴趣标签及其权重。
在上述技术方案中,步骤(2)中进行文本分词的具体方法包括:
(2-1)通过筛选情绪词典的方法和人工标注的方法,获得学习情绪词典;
(2-2)使用新词发现方法从网络课程的学习材料(例如:课件和习题等)中获取领域知识相关的命名实体词,获得领域知识命名实体词典;
(2-3)基于领域知识命名实体词典和学习情绪词典,对学习者生成内容进行分词,同时去除停用词和替换同义词。
在上述技术方案中,步骤(3)中所述“基于时序-情绪-主题的文本建模算法”,包括:
(3-1)根据教育心理学理论建构时间、情绪、主题、词汇等多变量关联的概率图模型;
(3-2)读入分词后的学习者生成内容和学习情绪词典,设置主题数量和其他超参数;
(3-3)初始化句子的情绪类别和主题编号矩阵;
(3-4)通过吉布斯采样的多次迭代,估计每个句子的情绪和主题;
(3-5)计算每个学习者发帖的情绪-主题分布、情绪-主题-词分布、情绪分布、情感-主题-时序分布;
(3-6)计算主题数量评估曲线,选取最优主题数量。
在上述技术方案中,步骤(4)中所述“基于语义相似度计算方法,鉴别学习者的学习兴趣和非学习兴趣”,包括:
(4-1)使用维基百科和教学材料文本训练词向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010776809.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通用串行总线装置、系统及通讯设备
- 下一篇:神经网络计算方法、装置和存储介质