[发明专利]文档质量检测方法、装置、计算机设备及存储介质在审
申请号: | 202211114041.4 | 申请日: | 2022-09-14 |
公开(公告)号: | CN115359038A | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 冷绵绵 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T3/40;G06V30/19;G06V30/41;G06V30/414;G06N3/04;G06N3/08 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 姚章国 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 质量 检测 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种文档质量检测方法、装置、计算机设备及存储介质,该文档质量检测方法,包括:获取待检测文档图像;对待检测文档图像进行文本块提取,获取至少两个目标文本块;对至少两个目标文本块进行拼接处理,获取目标检测文档图像;采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理,获取空间融合特征;根据空间融合特征,获取待检测文档图像对应的文档质量评分。本技术方案结合目标文本块在空间位置这一维度,对待检测文档图像进行质量检测,使文档质量检测更加趋近于人工检测的效果,提高文档质量检测的准确性。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文档质量检测方法、装置、计算机设备及存储介质。
背景技术
文档资料自动化识别对于提高信息的转储和分析效率至关重要。在一些业务场景中,例如在保险业务中,有大量的文档资料以图片的形式上传,因此,自动化识别文档资料中的信息能够极大的减轻人工录入和核对的负担。
然而,在对文档资料对应的文档图像进行识别过程中,常常因为上传文档图像的质量太差而不能准确的提取文档资料的信息,所以在对文档资料进行信息提取前,需要对质量差的文档图像进行拦截,及时的通知用户重新上传质量符合要求的文档图像,提高整体流程的流转效率。
传统的文档质量分析方法通常是直接对整张文档图像进行质量检测,容易使文档图像的背景区域对文档图像的质量评价造成干扰,影响文档质量检测的准确性。
发明内容
本发明实施例提供一种文档质量检测方法、装置、计算机设备及存储介质,以解决文档质量检测的准确性较差的问题。
一种文档质量检测方法,包括:
获取待检测文档图像;
对所述待检测文档图像进行文本块提取,获取至少两个目标文本块;
对至少两个所述目标文本块进行拼接处理,获取目标检测文档图像;
采用预先训练的文档检测模型对所述目标检测文档图像进行空间特征融合处理,获取空间融合特征;
根据所述空间融合特征,获取所述待检测文档图像对应的文档质量评分。
一种文档质量检测装置,包括:
图像获取模块,用于获取待检测文档图像;
文本块提取模块,用于对所述待检测文档图像进行文本块提取,获取至少两个目标文本块;
拼接处理模块,用于对至少两个所述目标文本块进行拼接处理,获取目标检测文档图像;
空间融合模块,用于采用预先训练的文档检测模型对所述目标检测文档图像进行空间特征融合处理,获取空间融合特征;
质量评分模块,用于根据所述空间融合特征,获取所述待检测文档图像对应的文档质量评分。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述文档质量检测方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述文档质量检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211114041.4/2.html,转载请声明来源钻瓜专利网。