[发明专利]一种针对主观题的自动评分及纠错推荐方法在审
申请号: | 202110672735.9 | 申请日: | 2021-06-17 |
公开(公告)号: | CN113392187A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 马黎 | 申请(专利权)人: | 上海出版印刷高等专科学校 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/31;G06F40/289;G06K9/00;G06N3/04 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 主观题 自动 评分 纠错 推荐 方法 | ||
1.一种针对主观题的自动评分及纠错推荐方法,其特征在于,包括以下步骤:
步骤S1,建立题库,该题库中包括题目以及所述题目对应的标准答案、知识点标签和题目号;
步骤S2,对所述题库中的所述题目号建立多位倒排索引表,并组建多位倒排索引总库;
步骤S3,接收待评分的答题卷图片,根据目标切分算法划分出题目区域以及答案区域;
步骤S4,使用OCR技术识别出所述题目区域中的题目文本来得到试卷题目,根据多位检索算法以及题目匹配算法从所述题库中找到与所述试卷题目匹配的所述题目,并对应提取出所述标准答案和所述知识点标签;
步骤S5,使用OCR技术识别出所述答案区域的答案文本来得到试卷答案,根据答案匹配算法计算所述试卷答案和所述标准答案的相似度,并提供所述试卷答案与所述标准答案相比的不足;
步骤S6,根据推荐策略从所述题库中搜索与所述试卷题目相似的所述题目来进行知识点巩固,
其中,所述步骤S5中,所述答案匹配算法的具体步骤如下:
步骤S5-1,使用OCR技术识别出所述答案区域的所述答案文本,得到所述试卷答案,记为Daan,并记所述步骤S4返回的所述标准答案为Biaozhun;
步骤S5-2,使用bert预训练模型或者xlnet预训练模型生成所述试卷答案Daan与所述标准答案Biaozhun的句子向量,并使用余弦相似算法计算向量之间的相似度Sim1,0≤Sim1≤1;
步骤S5-3,对所述试卷答案Daan使用textrank算法提取出关键词集合G1,对所述标准答案Biaozhun使用textrank算法提取出关键词集合G2,并计算两组关键词集合的相似度Sim2,0≤Sim2≤1,相似度Sim2的计算公式如下:
步骤S5-4,对相似度Sim1和相似度Sim2进行融合,得到相似度Sim,计算公式如下:
Sim=Sim1×a+Sim2×b (2)
步骤S5-5,根据所述试卷题目的设置分值进行相似度Sim映射并返回所述试卷答案的得分,另外将关键词集合G2中存在的但关键词集合G1中不存在的元素也返回,该元素表示所述试卷答案与所述标准答案相比的不足特征,
公式(2)中,a、b分别为相似度Sim1和相似度Sim2的权重,满足a+b=1且a≥b。
2.根据权利要求1所述的针对主观题的自动评分及纠错推荐方法,其特征在于:
其中,所述步骤S1中,所述题目、所述标准答案和所述知识点标签来源于各种书籍以及互联网资源,所述题目号由所述题目生成,具体生成步骤如下:
步骤S1-1,将所述题目的文本进行分词处理;
步骤S1-2,以MD5算法作为伪随机数生成器,以TF-IDF算法或BM25算法计算分词后各个词的词权重;
步骤S1-3,根据所述伪随机数生成器和所述词权重,使用128位simhash算法生成所述题目的文本所对应的hash值,并将该hash值作为所述题目号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海出版印刷高等专科学校,未经上海出版印刷高等专科学校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110672735.9/1.html,转载请声明来源钻瓜专利网。