[发明专利]重题检测方法、装置、电子设备及存储介质在审
申请号: | 202310075938.9 | 申请日: | 2023-02-07 |
公开(公告)号: | CN116012866A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 凌超;沙晶;王士进 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/19;G06V30/146 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨明月 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 方法 装置 电子设备 存储 介质 | ||
1.一种重题检测方法,其特征在于,包括:
获取待检测题;
从多个候选题中确定所述待检测题的相似题;
基于第一相似度、所述待检测题的题目特征和所述相似题的题目特征,确定所述待检测题与所述相似题是否为重题;所述第一相似度为所述待检测题的第一文本图像特征和所述相似题的第二文本图像特征之间的相似度,所述第一文本图像特征为基于所述待检测题的文本和所述待检测题对应的图像确定的,所述第二文本图像特征为基于所述相似题的文本和所述相似题对应的图像确定的。
2.根据权利要求1所述的重题检测方法,其特征在于,所述基于第一相似度、所述待检测题的题目特征和所述相似题的题目特征,确定所述待检测题与所述相似题是否为重题,包括:
确定所述待检测题的题目特征和所述相似题的题目特征之间的第二相似度;
对所述待检测题进行关键词检测,基于检测到的关键词分别确定所述第一相似度对应的第一权重和所述第二相似度对应的第二权重;
基于所述第一相似度、所述第一权重、所述第二相似度和所述第二权重,确定所述待检测题与所述相似题之间的目标相似度;
基于所述目标相似度,确定所述待检测题与所述相似题是否为重题。
3.根据权利要求1所述的重题检测方法,其特征在于,所述方法还包括:
将所述待检测题的文本和所述待检测题对应的图像输入至文本图像特征提取模型,得到所述文本图像特征提取模型输出的第一文本图像特征;
其中,所述文本图像特征提取模型为基于门控特征融合机制和自注意力机制构建,并通过文本样本、对所述文本样本进行图像采集得到的图像样本训练得到的。
4.根据权利要求3所述的重题检测方法,其特征在于,所述方法还包括:
在确定所述待检测题与所述相似题为非重题的情况下,分别确定所述待检测题的第一答案和所述相似题的第二答案;
在所述第一答案和所述第二答案相同的情况下,基于所述相似题更新所述文本图像特征提取模型的模型参数。
5.根据权利要求4所述的重题检测方法,其特征在于,所述方法还包括:
在多个所述候选题中不存在所述待检测题的相似题,或者所述第一答案和所述第二答案不相同的情况下,将所述待检测题加入候选题库,所述候选题库中包括多个所述候选题。
6.根据权利要求1-5任一项所述的重题检测方法,其特征在于,所述方法还包括:
基于所述待检测题的文本,确定所述待检测题的至少一个文本行;
针对每个文本行,获取所述文本行所在的文本框位置;
基于所述文本行和所述文本框位置,确定所述文本行的文本编码特征,并基于所述待检测题对应的图像和所述文本行所在的文本框位置,确定所述文本行的视觉特征;
对所述文本行的文本编码特征和所述视觉特征进行融合,得到融合特征;
基于至少一个文本行的融合特征,确定所述待检测题的第一文本图像特征。
7.根据权利要求6所述的重题检测方法,其特征在于,所述对所述文本行的文本编码特征和所述视觉特征进行融合,得到融合特征,包括:
基于所述文本行的文本编码特征和所述视觉特征,利用门控特征融合机制,确定所述文本行对应的第一特征;
根据所述文本行对应的第一特征,确定所述文本行与所述待检测题中的其他文本行之间的注意力分数,并根据所述注意力分数,确定所述文本行的融合特征。
8.一种重题检测装置,其特征在于,包括:
获取模块,用于获取待检测题;
确定模块,用于从多个候选题中确定所述待检测题的相似题;
所述确定模块,还用于基于第一相似度、所述待检测题的题目特征和所述相似题的题目特征,确定所述待检测题与所述相似题是否为重题;所述第一相似度为所述待检测题的第一文本图像特征和所述相似题的第二文本图像特征之间的相似度,所述第一文本图像特征为基于所述待检测题的文本和所述待检测题对应的图像确定的,所述第二文本图像特征为基于所述相似题的文本和所述相似题对应的图像确定的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310075938.9/1.html,转载请声明来源钻瓜专利网。