[发明专利]基于文本分析及关联规则挖掘的概念图自动生成方法在审
申请号: | 201810932453.6 | 申请日: | 2018-08-16 |
公开(公告)号: | CN109299282A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 邵增珍;李彦聪;郭延辉;赵学臣;王萧;董树霞 | 申请(专利权)人: | 山东女子学院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F17/27 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250300 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 概念图 关联规则挖掘 文本分析 自动生成 文本分类 试题 数据挖掘算法 生成算法 手工分类 结构化 文本 分类 监督 | ||
本实施例公开了一种基于文本分析及关联规则挖掘的概念图自动生成方法,基于文本分析技术中的文本分类方法,将试题分类到对应的概念中,采用有监督的数据挖掘算法处理无结构化的试题文本;将文本分析技术中的文本分类方法同关联规则挖掘相结合,得到生成的概念图。本发明能够代替专家手工分类的过程,并结合当前概念图生成算法中的关联规则挖掘方法,实现概念图的自动生成。
技术领域
本实施例涉及一种基于文本分析及关联规则挖掘的概念图自动生成方法。
背景技术
随着教育信息化和教育现代化的不断推进,教育数据挖掘已成为国内外研究者关注的重点。为促进教育技术的发展,多种有关教育数据挖掘的技术被不断提出。作为教育数据挖掘中有效的知识可视化工具,概念图已成为当前研究的热点。概念图由美国康奈尔大学的Novak博士于1984年首次提出,它通过直观且接近自然语言的图形化方式表述概念间的关联。近年来概念图的表现形式仍以Novak的网络型概念结构图为标准,使用节点表示概念,使用有向边表示概念间的关联方向,并在边上使用介词标签表示概念间的归属关系。
有关概念图,国内外学者进行了大量研究,并广泛应用到不同学科领域中,如教学诊断、知识组建、临床护理等,取得了一定成果。但早期概念图的生成主要依赖于专家经验,不仅耗费时间长,且难以保证其正确性。近年来,依赖教育数据挖掘技术的概念图自动生成方法不断被提出。Jiang等人提出了一种可以理解手绘概念图结构的方法和一种基于结构的智能操作技术。然而概念图首先需要由专家手工绘制生成。Chen等人利用文本分析技术从文献中自动生成电子学习领域的概念图。但他们仅考虑了单词间的关联规则而没有反映概念之间的关联。Caputo等人使用文本分析技术中的自然语言处理方法从电子商务网页中生成概念图。他们使用信息提取方法来挖掘概念并分析它们的关联,但并未充分考虑动态数据在概念图生成过程中的作用。Huang等人提出了一种模拟数据集下的概念图自动生成算法。他们通过使用改进的Apriori算法计算概念之间的相关性,但试题和概念之间的归属关系仍由专家手工分类所得。Atapattu等人从课堂幻灯片中提取出概念图并且将其应用于教育学工具。然而他们仅考虑幻灯片内容,未足够重视学生答题记录等课堂动态数据。简言之,近年来研究者在概念图的自动生成算法方面取得了很大的成就。然而这些研究存在共同的局限性,如过度依赖专家经验,导致生成概念图的时间长,并缺乏对学生答题记录等动态数据的合理使用。
发明内容
本实施例为了解决上述问题,提出了一种基于文本分析及关联规则挖掘的概念图自动生成方法,本实施例采用模块化设计、体积小、换热效率高、可靠性高且成本低。
为了实现上述目的,本实施例采用如下技术方案:
一种基于文本分析及关联规则挖掘的概念图自动生成方法,基于文本分析技术中的文本分类方法,将试题分类到对应的概念中,采用有监督的数据挖掘算法处理无结构化的试题文本;将文本分析技术中的文本分类方法同关联规则挖掘相结合,得到生成的概念图。
进一步的,在试题文本分析阶段,从试题中提取文本特征,建立分类模型,并利用文本分析中的文本分类方法将试题分类到概念,获得试题和概念之间的关联。
进一步的,在概念间的关联规则挖掘阶段,首先生成测试问题频繁项集,并结合答题记录,将前一阶段获取的试题和概念之间的关联,映射为概念之间的关联,最终生成概念图。
更进一步的,所述测试问题频繁项集为测试问题的出现频率高于设定值的所有测试问题集合。
进一步的,试题文本分析阶段,对试题文本进行分词和停用词的过滤,继而进行文本特征的提取,对提取的特征进行分类,得到分类结果,将试题自动分类到概念。
更进一步的,选择TF-IDF方法来提取文本特征,并将分词及停用词过滤后的试题转化为可被计算机理解的向量空间模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东女子学院,未经山东女子学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810932453.6/2.html,转载请声明来源钻瓜专利网。