[发明专利]主观题评分及其模型的构建方法、电子设备及存储介质在审
申请号: | 201810039229.4 | 申请日: | 2018-01-16 |
公开(公告)号: | CN108363687A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 郑文照;王小涛 | 申请(专利权)人: | 深圳市脑洞科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 石伍军;张鹏 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主观题 文本特征 训练样本 评分模型 答题 构建 样本 存储介质 电子设备 输入机器 机器学习模型 评分结果 人力成本 整体特征 预设 输出 学习 应用 | ||
本发明公开了一种主观题评分及其模型的构建方法、电子设备及存储介质,其中主观题评分模型的构建方法包括:获取训练样本,训练样本包括多个主观题答题样本以及每个答题样本所对应的人工评分;提取训练样本的文本特征,文本特征包括答题样本的整体特征和单句特征;将文本特征和对应的人工评分输入机器学习模型进行训练,直到机器学习模型的输出分数与人工评分的差值达到预设值。本发明通过将训练样本的文本特征和对应的人工评分输入机器学习模型,训练出主观题评分模型,将此主观题评分模型应用于主观题评分中,可以有效降低人力成本,且可以克服人工评分中仅依靠关键词所造成的评分结果不准确、评分不公平的问题。
技术领域
本发明涉及机器学习领域,尤其涉及一种主观题评分及其模型的构建方法、电子设备及存储介质。
背景技术
目前,对主观题进行评分大多停留在关键词的匹配上,也就是用大量的人工罗列出所有可能的关键词,然后查找考生的答案中是否出现这些可能的关键词,如果出现这些可能的关键词,则得分,否则不得分。
该技术需要大量的人工,对主观题的每一个要点都罗列出所有可能的关键词需要不小的人力;对负责罗列关键词的人工素质要求比较高,为了罗列出尽量多的可能关键词,需要专业的申论教学人员。另外,句子虽然由词语组成,但词与词之间的关系也隐藏了大量的语义信息,基于关键词的匹配会导致这一部分信息丢失,导致评分结果不准确。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种主观题评分模型的构建方法,通过该模型对主观题进行评分,以解决现有人工评分中人力成本高且评分结构不准确的问题。
本发明的目的之二在于提供一种主观题评分方法,以解决现有人工评分中人力成本高且评分结构不准确的问题。
本发明的目的之三在于提供一种电子设备,以解决现有人工评分中人力成本高且评分结构不准确的问题。
本发明的目的之一采用如下技术方案实现:
一种主观题评分模型的构建方法,包括:
获取训练样本,所述训练样本包括多个主观题答题样本以及每个答题样本所对应的人工评分;
提取所述训练样本的文本特征,所述文本特征包括答题样本的整体特征和单句特征;
将所述文本特征和对应的人工评分输入机器学习模型进行训练,直到机器学习模型的输出分数与所述人工评分的差值达到预设值。
进一步地,所述提取所述训练样本的文本特征包括:
提取所述训练样本的整体特征;
对所述训练样本进行拆分,计算单句相似度。
进一步地,所述计算单句相似度包括:
获取单句句型和对应的单句句型的相似度计算参数;
根据相似度计算参数计算单句与参考答案中对应语句的相似度。
进一步地,所述根据相似度计算参数计算单句与参考答案中对应语句的相似度包括:
计算单句与参考答案中对应语句的句法相似度;
计算单句与参考答案中对应语句的语法相似度;
根据所述句法相似度、所述语法相似度及所述相似度计算参数计算单句相似度。
进一步地,所述计算单句与参考答案中对应语句的句法相似度包括:
对单句和参考答案中对应语句进行分词和词性标注;
计算所述单句和所述参考答案中对应语句的词性的数量;
根据所述词性的数量计算单句和参考答案中对应语句的句法相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市脑洞科技有限公司,未经深圳市脑洞科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810039229.4/2.html,转载请声明来源钻瓜专利网。