[发明专利]数据处理方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202010969800.X | 申请日: | 2020-09-15 |
公开(公告)号: | CN112183253A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 黄恺;周佳;闫嵩;包英泽 | 申请(专利权)人: | 北京大米科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06Q50/20;G06T7/12;G06F16/33 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100142 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取版面图片,所述版面图片显示有多个答题子区域,所述答题子区域中包括第一文本和第二文本,相邻的答题子区域之间设置有分隔标识;
根据所述版面图片确定多个答题子图片和对应的题目区域坐标,所述多个答题子图片分别对应于不同的答题子区域;
确定所述版面图片内的第一文本信息和第二文本信息,所述第一文本信息包括第一文本坐标和第一文本序列,所述第二文本信息包括第二文本坐标和第二文本序列;
根据所述各所述题目区域坐标、第一文本信息及第二文本信息确定所述各题目的第一文本和第二文本;
根据所述各题目的第一文本确定对应的第三文本信息;以及
根据所述第三文本信息确定各题目的第四文本信息。
2.根据权利要求1所述的数据处理方法,其特征在于,所述分隔标识为多个所述答题子区域外围显示的闭合的虚线题框;
根据所述版面图片确定多个答题子图片和对应的题目区域坐标包括:
调整所述版面图片尺寸至预定尺寸,得到第一版面图片;
对所述第一版面图片进行图像二值化,得到第二版面图片;
对所述第二版面图片进行图像闭操作,得到第三版面图片;
对所述第三版面图片进行连通域分析和筛选,得到题目区域题框;以及
调整所述题目区域题框尺寸至原始尺寸,确定各所述答题子图片和对应的题目区域坐标;
其中,所述题目区域坐标用于表征各所述答题子区域在版面图片上的位置信息。
3.根据权利要求1所述的数据处理方法,其特征在于,所述确定所述版面图片内的第一文本信息和第二文本信息包括:
将所述版面图片输入至文本分割网络,获取多个特征向量;以及
对所述多个特征向量进行文本检测和文本识别,获取第一文本序列和第二文本序列以及第一文本坐标和第二文本坐标;
其中,所述第一文本序列为所述版面图片内的印刷体文本内容,所述第一文本坐标为所述第一文本序列在所述版面图片上的位置信息;所述第二文本序列为所述版面图片内的手写体内容,所述第二文本坐标为所述第二文本序列在所述版面图片上的位置信息。
4.根据权利要求3所述的数据处理方法,其特征在于,所述文本分割网络的主干网络结构为残差网络模型,所述文本识别网络采用卷积神经网络模型。
5.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述各所述题目区域坐标、第一文本信息及第二文本信息确定所述各题目的第一文本和第二文本具体为:
根据各所述题目的题目区域坐标、第一文本坐标和第二文本坐标对所述第一文本信息和第二文本信息进行分析筛选;以及
将满足预设条件的第一文本序列和第二文本序列作为所述各题目的第一文本和第二文本。
6.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述各题目的第一文本确定对应的第三文本信息具体为:
根据所述各题目的第一文本对题库内容进行搜索,确定匹配度最高的题目标识;以及
获取所述题目标识对应的标准答案信息,并将所述标准答案信息作为第三文本信息;
其中,所述第三文本信息为所述各题目的正确答案信息。
7.根据权利要求6所述的数据处理方法,其特征在于,所述根据所述各题目的第一文本对题库内容进行搜索,确定匹配度最高的题目标识具体为:
采用模糊匹配的方式对题库中的题目进行搜索,并将边界距离相似度最高的题目标识作为匹配度最高的题目标识。
8.根据权利要求6所述的数据处理方法,其特征在于,所述根据所述第三文本信息确定各题目的第四文本信息具体为:
将所述各题目的第二文本与所述第三文本信息进行比对,确定所述各题目的第四文本信息;
其中,所述第四文本信息为所述各题目的批改信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大米科技有限公司,未经北京大米科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010969800.X/1.html,转载请声明来源钻瓜专利网。