[发明专利]一种基于自由文本的中文选择题干扰项生成方法有效
申请号: | 202110113550.4 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112686025B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 戴剑锋;吴梦莹;董黎刚;蒋献 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295;G06F40/30;G06F18/22;G06F16/36;G06N3/049;G06N3/08;G06N3/088 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林松海 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自由 文本 中文 选择题 干扰 生成 方法 | ||
本发明公开了一种基于自由文本的中文选择题干扰项生成方法,步骤包括:1‑1)对文本进行预处理,解析出核心关键词;1‑2)选择信息句;1‑3)生成正确答案;1‑4)生成问题题干;1‑5)扩展正确答案;1‑6)生成干扰项:基于向量空间模型进行扩展词向量化,使用TF‑IDF方法计算各个扩展词在向量空间里的权重;利用LSI模型将文本用“词语‑文本”矩阵表示,利用奇异值分解将高维稀疏的矩阵转换成低维的文本向量和单词向量,结合扩展词向量空间权重,用余弦相似度方法计算扩展词与知识图谱中三元组的语义相似度;筛选出干扰项;1‑7)结合题干和干扰项生成选择题。本发明生成速度快,占用资源少,难度高,适用于标准化教学和机器学习。
技术领域
本发明涉及自然语言处理领域,尤其是一种基于自由文本的中文选择题干扰项生成方法。
背景技术
虽然目前对问题生成的研究较多,但是对选择题生成的研究较少。国内外对选择题自动生成技术的研究大部分都是针对英文的词汇和语法。选择题作为考试题型中最常出现、占比很大的一种题型,在教育评价和主动学习中都起着重要作用。如果能根据输入的文本自动生成选择题,那么对学生的学习和机器学习有着很大的帮助。试卷中传统的选择题生成方法是由人工构造试题库,再从试题库中随机抽取题目,人工生成选择题是一项非常耗费人力和时间的任务,并且需要专业领域的相关知识。因此如果能根据输入的文本自动生成选择题,学生在学习完一段文本后就能快速获得相关的问题,并对自己的知识掌握能力进行测试。所以选择题的自动生成不仅对教师出题有很大的帮助,对学生的学习效率也有很大的提升。
选择题的三要素是:问题题干、正确答案和干扰项。这三个关键点中往往最重要的就是干扰项的生成,干扰项的难度直接决定了选择题的难度。如何生成一个好的干扰项,对选择题的研究有着重要意义。生成更高质量的干扰项的含义是使干扰项能更接近于正确答案,对做题者产生更高的迷惑性。
目前大部分干扰项都是针对英文问题生成的,主要是采用计算语义相似度的方法,目前采用的相似度计算方法有基于本体的,基于语料库的方法和基于图的方法。在基于语料库的方法中,根据文本的上下文信息来计算相似度,有学者研发的系统基于潜在语义分析模型(LSA),使用文本中的上下文词语来计算相似度。LSA是一种通过应用于语料库的统计计算来提取和表示词义的理论和方法,在许多教育应用中取得了不错的成果。基于图形的方法使用HowNet、WordNet、同义词库和领域知识库等知识资源库来计算以图形表示的词汇知识库中两个概念或单词之间的语义距离。除了语义相似计算方法外,还有其他研究者提出利用词频和词性信息来产生干扰项。然而,这些方法都是针对英文选择题生成的。
Mitkov等人研究了几种不同的相似性度量方法,旨在确定哪些相似性度量能产生更好的选择题干扰项。Liu等人提出了一种混合相似度策略,利用统计回归模型生成中文选择题的干扰项,并将混合策略与其他三种常见的干扰源生成策略,即正字法策略、语义策略和语音策略进行了比较。其中一个重要的发现表明,混合策略在分心有效性方面显著优于其他三种策略,并且具有最高的辨别力。Jiang等人首次研究了汉语学习中自动生成填空题干扰项,使用的语义相似性度量是基于word2vec模型的。评估表明,基于word2vec模型的语义相似性度量比只考虑词性和词频的基线有了显著的改进,并且与人工产生的选项相比更具有竞争力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110113550.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于温度测量仪的防跟进安全闸门装置
- 下一篇:一种新型暖风器系统布置方法