[发明专利]一种利用IRT与梯度下降的词汇量测评方法在审
申请号: | 201811300014.X | 申请日: | 2018-11-02 |
公开(公告)号: | CN111144600A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 常万里;贾艳明 | 申请(专利权)人: | 北京博智天下信息技术有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 irt 梯度 下降 词汇量 测评 方法 | ||
本发明涉及一种利用IRT与梯度下降的词汇量测评方法,属于计算机辅助英语教育领域。本发明首先采用项目反应理论对已有的用户做题情况进行分析,并结合梯度下降推断出所有单词的难度;接着,对于一个新来测评的用户,通过少量单词测试的做题情况,精准推断出他的能力值:最后,根据用户的能力值以及所有单词的难度,推断出每个单词的认识的概率,所有单词的认识概率的总和即为总词汇量。本发明有以下两大改进:精准量化了单词难度与用户能力值以及每个单词认识的概率;对测评词汇没有要求,灵活性强,准确率高,算法求解过程简捷快速。
技术领域
本发明涉及一种利用IRT与梯度下降的词汇量测评方法,属于计算机辅助英语教育领域。
背景技术
在大数据背景下,学生的词汇测量情况可以被大量且有效的收集,那么对于这些大数据(Big Data),如何设计出一种算法快速准确的反应出学生的英语词汇量是语言学习领域的一项重要研究课题。
传统的词汇量测评方法大多基于经验,根据固定的测评词汇来推测学生的词汇量。在这一过程中,词汇难度系数人为生成,如根据词频,不够客观;测评词汇单一固定,如根据特定规则对测评词汇进行筛选或者采取等间距抽样,不够灵活;测评结果往往是一个范围,不够准确。
项目反应理论(Item ResponseTheory,IRT)是用来分析考试成绩或者问卷调查数据的数学模型,它通过对已有数据进行分析,推断出单词的难度与学生的能力,进而可以精准的预测出学生对于每个单词认识的概率,最终生成学生词汇量。但是传统的项目反应理论通过EM算法求解,求解过程繁琐且可扩展性差,且对于大数据量的数据求解十分缓慢。
本发明针对现有方法的不足,提出了利用IRT与梯度下降的词汇量测评方法。该方法保留了传统项目反应理论的核心思想,仅使用学生能力与题目难度两个参数,保证了算法的鲁棒性,降低了过拟合的风险。同时通过梯度下降简化了求解过程,提高了算法的可扩展性,并利用GPU极大的加快了求解速度,并且可以用更少的测评词汇精准的推断出用户的词汇量。
发明内容
本发明提出一种利用IRT与梯度下降的词汇量测评方法。该方法的关键是利用项目反应理论根据已有数据对单词难度和用户能力进行推断求解,并利用GPU提高梯度下降的求解速度。
下面将从模型的构建、模型参数初始化方法和模型训练方法三个方面详细阐述基于梯度下降的项目反映理论的形成过程。
模型的构建:
模型构建公式如下所示:
(1)
其中,为用户的能力值,为单词的难度,为用户认识单词的概率。
模型参数初始化方法:
首先统计已有词汇测评数据中用户数目以及单词数目,假设有 m 位用户、n 个单词。然后采取正态分布随机生成 m 位用户的能力值与 n 道题目的难度。
模型训练方法:
对于已有词汇测评数据中的一条记录,能力为的用户 j 做了难度为的题目i且正确情况为,根据公式我们预测的该题目的正确情况为:
那么损失函数为:
通过梯度下降对和进行更新。
本发明提出的利用IRT与梯度下降的词汇量测评方法,可以更好的模拟学生的能力与题目难度,更加准确的预测学生的词汇量,更快的运行速度,很好的弥补现有词汇量预测方法的缺点和不足。
附图说明:
图1IRT模型生成流程图
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京博智天下信息技术有限公司,未经北京博智天下信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811300014.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理