[发明专利]定标集更新方法及装置有效
申请号: | 201811230610.5 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109408638B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 汪洋;张凯波;李松;竺博;魏思;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q10/06;G06Q50/20 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 定标 更新 方法 装置 | ||
本发明实施例提供一种定标集更新方法及装置,属于人工智能技术领域。该方法包括:获取当前考试的考卷,将每一考卷中的文本内容转化为高维表示向量,并将定标集中每一样本考卷转化为高维表示向量;对所有高维表示向量进行聚类,根据每一考卷对应的聚类结果与定标集之间的距离,计算每一考卷对应的目标距离;将目标距离大于预设阈值的考卷作为目标样本考卷,根据目标样本考卷更新定标集。由于可确定当前考试的所有考卷中未被定标集涵盖的考卷,并可根据未被定标集涵盖的考卷更新定标集,从而使得后续根据定标集进行机器评分时,评分结果更加准确。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种定标集更新方法及装置。
背景技术
由于人工评卷比较耗费人力成本且容易出现主观性的误差,从而现如今计算机评卷越来越普及。目前一般是通过试卷评分系统进行评分,其中,试卷评分系统是基于定标集训练得到的,定标集中包括多组定标数据,每组定标数据包括样本试卷及样本试卷的评分。实际应用中,将试卷内容输入至试卷评分系统即可得到该试卷的评分。由于用于训练试卷评分系统的样本试卷类型通常比较局限,不能将实际判卷时的所有试卷类型覆盖,从而导致评分结果不准确。
发明内容
为了解决上述问题,本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的定标集更新方法及装置。
根据本发明实施例的第一方面,提供了一种定标集更新方法,包括:
获取当前考试的考卷,将每一考卷中的文本内容转化为高维表示向量,并将定标集中每一样本考卷转化为高维表示向量;
对所有高维表示向量进行聚类,根据每一考卷对应的聚类结果与定标集之间的距离,计算每一考卷对应的目标距离;
将目标距离大于预设阈值的考卷作为目标样本考卷,根据目标样本考卷更新定标集。
本发明实施例提供的方法,通过获取当前考试的考卷,将每一考卷中的文本内容转化为高维表示向量,并将定标集中每一样本考卷转化为高维表示向量。对所有高维表示向量进行聚类,根据每一考卷对应的聚类结果与定标集之间的距离,计算每一考卷对应的目标距离。将目标距离大于预设阈值的考卷作为目标样本考卷,根据目标样本考卷更新定标集。由于可确定当前考试的所有考卷中未被定标集涵盖的考卷,并可根据未被定标集涵盖的考卷更新定标集,从而使得后续根据定标集进行机器评分时,评分结果更加准确。
根据本发明实施例的第二方面,提供了一种定标集更新装置,包括:
转化模块,用于获取当前考试的考卷,将每一考卷中的文本内容转化为高维表示向量,并将定标集中每一样本考卷转化为高维表示向量;
聚类模块,用于对所有高维表示向量进行聚类,根据每一考卷对应的聚类结果与定标集之间的距离,计算每一考卷对应的目标距离;
更新模块,用于将目标距离大于预设阈值的考卷作为目标样本考卷,根据目标样本考卷更新定标集。
根据本发明实施例的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与处理器通信连接的至少一个存储器,其中:
存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的定标集更新方法。
根据本发明的第四方面,提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的定标集更新方法。
应当理解的是,以上的一般描述和后文的细节描述是示例性和解释性的,并不能限制本发明实施例。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811230610.5/2.html,转载请声明来源钻瓜专利网。