[发明专利]关键词的确定方法、自动评分方法、装置、设备及介质在审
申请号: | 201910049180.5 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109829155A | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/332;G06K9/62 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 答题信息 决策树 核心关键词 答题数据 特征转化 样本模型 样本训练 决策树模型 参考模型 分词处理 考生答题 分词 | ||
本发明公开了一关键词的确定方法、自动评分方法、装置、设备及介质;在关键词的确定阶段,通过获取第一样本答题数据,对第一样本答题数据中的样本答题信息进行分词处理和汇总,得到样本分词集;然后对样本答题信息进行特征转化,得到样本训练特征;根据样本训练特征和第一评分值对决策树模型进行训练,得到决策树样本模型;并从决策树样本模型中提取样本关键词;在自动评分方法阶段,通过从待评分答题信息中提取关键词,得到核心关键词;通过目标考点对核心关键词进行特征转化,得到待评分考点特征后输入到决策树参考模型中,得到待评分答题信息的准确分值;不但提高了关键词的泛化能力和准确性,还实现了对考生答题内容的高效准确评分。
技术领域
本发明涉及智能决策领域,尤其涉及一种关键词的确定方法、自动评分方法、装置、计算机设备及存储介质。
背景技术
随着社会的发展,竞争越来越大,而考试逐渐成为了衡量一个人学到多少知识掌握多少技能的一项常规手段,因此一系列对考生的答题内容进行评分的系统也随着考试的盛行而发展起来。随着计算机技术的发展,对于考生客观题的答题内容已经可实现全自动的计算机在线阅卷并实时评分,但是基于主观题存在一定的随机性以及记忆成分,若根据同样的评分方法,采用计算机对考生主观题的答题内容进行评分,则极易发生误判或者产生误差。此外,如果采用人工阅卷,当考生人群数量较大时,人工评分的工作量就会变得非常大,操作也会变得非常困难。目前,对考生主观题的答题内容进行评分的方法通常是预先通过评分规则信息,人工确立考点内容以及相关关键词,然后根据考点内容以及相关关键词,通过正则匹配方法识别答题内容,对考生的答题内容进行评分。然而,只通过评分规则信息而不考虑其它考生对同一主观题的答题情况,所确定的考点以及相关关键词不但泛化能力较低,且准确性不高。因此也会导致在后续对考生的答题内容进行评分时,得出的最终评分结果出现偏差,而无法体现考生的真实水平。
发明内容
本发明实施例提供一种关键词的确定方法、装置、设备及存储介质,以解决关键词泛化能力低、准确性不高的问题。
本发明实施例提供一种自动评分方法、装置、设备及存储介质,以解决无法对考生的答题内容进行高效准确评分的问题。
一种关键词的确定方法,包括:
获取N个第一样本答题数据,每一所述第一样本答题数据包括样本答题信息和第一评分值,N为正整数;
对每一所述第一样本答题数据的所述样本答题信息进行分词处理,得到每一所述第一样本答题数据的样本分词;
对每一所述第一样本答题数据的所述样本分词进行汇总,得到样本分词集;
采用所述样本分词集对每一所述第一样本答题数据的所述样本答题信息进行特征转化,得到样本训练特征;
根据所述样本训练特征和对应的第一评分值对决策树模型进行训练,得到决策树样本模型;
从所述决策树样本模型中提取样本关键词。
一种自动评分方法,包括:
获取待评分答题信息;
对所述待评分答题信息进行关键词提取,得到核心关键词;
采用目标考点对所述核心关键词进行特征转化,得到待评分考点特征;其中,所述目标考点是采用权利要求2所述的关键词的确定方法所得的;
将所述待评分考点特征输入到预设的决策树参考模型中,得到所述待评分答题信息的准确分值。
一种关键词的确定装置,包括:
第一样本答题数据获取模块,用于获取N个第一样本答题数据,每一所述第一样本答题数据包括样本答题信息和第一评分值,N为正整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910049180.5/2.html,转载请声明来源钻瓜专利网。