[发明专利]图像文档处理方法、装置及计算机可读存储介质在审
申请号: | 202010434264.3 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111695441A | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 黄文韬;刘鹏;刘玉宇 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/46;G06K9/62 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 文档 处理 方法 装置 计算机 可读 存储 介质 | ||
本发明涉及人工智能中的图像处理领域,揭露了一种图像文档处理方法,包括:根据预设分类字段在模板图像中的位置生成第一区域图像,提取SIFT特征点生成第一区域图像的第一特征描述子和待处理图像的第二特征描述子并生成匹配点对,根据匹配点对生成变换矩阵,使用变换矩阵根据所述待处理图像生成第二区域图像,对第二区域图像进行处理生成输出图像,根据模板图像识别出输出图像中所需输出字段位置中的文本内容。本发明还提出一种电子装置以及一种计算机可读存储介质。本发明减少了图像非刚性形变导致全局模板结构化定位的错误以及图像文档结构化识别错误。另外,本发明还涉及区块链技术,本发明还可应用于智慧政务、智慧教育等领域中,从而推动智慧城市的建设。
技术领域
本发明涉及人工智能中的图像处理领域,尤其涉及一种图像文档处理方法、电子装置及计算机可读存储介质。
背景技术
近年来随着人工智能技术的迅猛发展,特别是深度学习在图像领域的成功应用,使得OCR技术得到了更加广泛的应用,特别在各种证件和图像文档的自动翻译、解析等方面的应用十分的广泛。
现有技术中,常采用两种方法对图像文档进行识别。一种是通过文档识别的结果得到关键字的位置,从而根据位置关系来确定所需分类字段的位置,最后根据各个位置里的识别内容确定最终的输出结果。这种方法的主要问题是当文档存在倾斜或者关键字识别错误时会对输出结果产生很大的影响,甚至导致输出错误。另一种方式是通过建立一个待识别文档的标准模板,然后对输入图像与该标准模板进行匹配和映射,最后根据标准模板的所需输出字段的位置对应的确定目标图像里的位置。然而,当输入图像存在非刚性形变时,难以找到这样的映射关系,导致定位结果出错,从而使得输出结果错误。
发明内容
鉴于以上内容,有必要提供一种图像文档处理方法,旨在非刚性形变导致文档结构化识别错误的问题。
本发明提供的图像文档处理方法,应用于电子装置,包括:
根据预设分类字段在模板图像中的位置生成第一区域图像,从所述第一区域图像中提取SIFT特征点生成所述第一区域图像的第一特征描述子,读取待处理图像并从所述待处理图像中提取SIFT特征点生成所述待处理图像的第二特征描述子;
将所述第一特征描述子与所述第二特征描述子进行匹配,生成所述第一区域图像和所述待处理图像之间的第一预设数量的匹配点对,每个匹配点对包括所述第一区域图像中的一个第一特征描述子和所述待处理图像中相匹配的一个第二特征描述子,使用预设算法过滤掉所述匹配点对中包括相同的第一、第二特征描述子的匹配点对;
根据过滤后的匹配点对生成所述第一区域图像的变换矩阵,根据所述变换矩阵及所述待处理图像生成第二区域图像;
根据所述第一区域图像的属性信息对所述第二区域图像进行处理生成输出图像,将所述输出图像与所述模板图像进行匹配和映射,根据所述模板图像所需输出字段的位置定位出所述输出图像中所需输出字段的位置,并识别出所述输出图像中所需输出字段位置中的文本内容。
可选的,所述根据预设分类字段在模板图像中的位置生成第一区域图像包括:
根据预设的分类字段确定与该预设分类字段对应的待提取字段,将所述模板图像中包含单个预设分类字段的文本框和包含与该预设分类字段对应的待提取字段的文本框划分为一个区域,依此方法将所述模板图像划分为两个或两个以上区域,所述划分区域后的模板图像视为第一区域图像。
可选的,所述第一区域图像包括两个或两个以上区域,所述根据过滤后的匹配点对生成所述第一区域图像的变换矩阵包括:
在所述第一区域图像的一个区域中随机选取第二预设数量过滤后的匹配点对,根据第二预设数量过滤后的匹配点对构建变换矩阵模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010434264.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序