[发明专利]一种面向主观题的智能阅卷方法有效
申请号: | 201910726595.1 | 申请日: | 2019-08-07 |
公开(公告)号: | CN110413741B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 孙宇清;李东进;袁峰;刘天元;张宝京;薛勇 | 申请(专利权)人: | 山东山大鸥玛软件股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06F40/211;G06N3/04 |
代理公司: | 济南竹森知识产权代理事务所(普通合伙) 37270 | 代理人: | 吕利敏 |
地址: | 250101 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 主观题 智能 阅卷 方法 | ||
1.一种面向主观题的智能阅卷方法,其特征在于,至少包括:
对考生答案文本和参考答案文本分别进行预处理,以获得二者对应的词向量序列表示;
将二者对应的词向量序列输入到第一语义特征抽取网络,利用第一语义特征抽取网络计算提取考生答案和参考答案中句子的语义向量,其中,句子的语义向量简记为句向量;利用融合注意力机制计算考生答案和参考答案句向量的语义匹配程度;利用此匹配结果,计算考生答案加权句向量,其中,所述考生答案加权句向量是指考生答案匹配参考答案的加权句向量;其中,所述融合注意力机制是指一方面度量考生答案匹配参考答案的程度,另一方面从参考答案的角度度量答案的每一个要点被匹配到的程度;
针对考生答案的句向量序列和基于融合注意力机制的加权句向量序列,将考生答案的句向量序列和基于融合注意力机制的加权句向量序列输入到第二语义特征向量,利用第二语义特征抽取网络分别计算提取考生答案句向量序列的语义向量和基于融合注意力机制的加权句向量序列的语义向量;将两个向量进行粘接,形成考生答案的最终向量表示;利用多层前馈神经网络对所述考生答案的最终向量表示进行;
所述对考生答案文本和参考答案文本进行预处理获得二者对应的词向量序列表示的方法包括:
将考生答案文本和参考答案文本进行分句、分词处理,将考生答案文本和参考答案文本按照逗号、句号、冒号和分号切分成短句;
使用预训练的词向量表示考生答案和参考答案中的词汇,对于不存在词向量的词汇进行二次分词,得到子词,将所述子词的词向量的均值作为该词汇的词向量;若该词汇的子词仍没有词向量,则对该子词继续进行拆分,直至拆分到有对应的词向量表示为止。
2.根据权利要求1所述的一种面向主观题的智能阅卷方法,其特征在于,所述利用第一语义特征抽取网络计算提取考生答案和参考答案句子的语义向量的方法包括:
将考生答案和参考答案的词向量序列分别输入第一语义特征抽取网络,得到考生答案和参考答案每句话的句向量;
第一语义特征抽取网络选取循环神经网络或卷积神经网络;
所述循环神经网络可选取单向或双向长短时记忆神经网络、单向或双向门控神经网络、普通循环神经网络;卷积神经网络可选取单层或多层卷积网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东山大鸥玛软件股份有限公司,未经山东山大鸥玛软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910726595.1/1.html,转载请声明来源钻瓜专利网。