[发明专利]文档图像生成方法、文档图像识别方法、装置及存储介质在审
申请号: | 202210122791.X | 申请日: | 2022-02-09 |
公开(公告)号: | CN114463239A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 司法 | 申请(专利权)人: | 云从科技集团股份有限公司 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T7/11;G06V30/418;G06V30/20;G06N3/04;G06N3/08 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 屠晓旭;陈敏 |
地址: | 511457 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 生成 方法 识别 装置 存储 介质 | ||
本发明涉及文档图像处理技术领域,具体提供一种文档图像生成方法、文档图像识别方法、装置及存储介质,旨在解决在获取少量文档图像的情况下如何生成大批量文档图像的问题。为此目的,本发明的图像生成方法包括提取文档图像模板中每个目标语义类型的目标文本的文本图像切片并通过去除文档图像模板中的目标文本来生成背景图像;对每个目标文本的文本图像切片分别生成相似的文本图像切片;在背景图像中每个目标文本的图像区域上,将每个目标文本的相似的文本图像切片与背景图像进行图像融合,生成新的文档图像。通过上述方法,可以保证新的文档图像与文档图像模板都包含相同语义类型的目标文本并且同一语义类型的目标文本在文档图像中的位置也相同。
技术领域
本发明涉及文档图像处理技术领域,具体提供一种文档图像生成方法、文档图像识别方法、装置及存储介质。
背景技术
目前为了提高文档图像的识别效率,主要是采用神经网络模型如基于光学字符识别OCR(Optical Character Recognition)识别技术的神经网络模型进行文档图像识别。而为了提高神经网络模型的识别准确性,需要采用大批量在真实业务场景下产生的文档图像作为图像样本进行模型训练,同时这些文档图像要能够覆盖光照、折痕和印刷错位等多种不同质量类型的图像。但是,在实际应用中,对于一些特定的业务场景比如金融业务场景,仅能获取少量的文档图像,而无法获取大批量的文档图像作为图像样本进行模型训练,从而无法利用神经网络模型对这些业务场景产生的文档图像进行较为准确的图像识别。
发明内容
为了克服上述缺陷,提出了本发明,以提供解决或至少部分地解决在获取少量文档图像的情况下如何生成大批量文档图像以进行神经网络模型训练,提高神经网络模型对文档图像识别准确率的技术问题的文档图像生成方法、文档图像识别方法、装置及存储介质。
在第一方面,本发明提供一种文档图像生成方法,所述方法包括:
分别提取文档图像模板中每个目标语义类型的目标文本的文本图像切片,并通过去除所述文档图像模板中的所述目标文本来生成背景图像;
对每个目标文本的文本图像切片分别生成相似的文本图像切片,所述相似的文本图像切片中的文本与相应目标文本的语义类型相同;
在所述背景图像中每个目标文本各自对应的图像区域上,将每个目标文本各自对应的相似的文本图像切片与所述背景图像进行图像融合,以生成新的文档图像。
在上述文档图像生成方法的一个技术方案中,“对每个目标文本的文本图像切片分别生成相似的文本图像切片”的步骤包括:
采用生成对抗网络GAN对每个目标文本的文本图像切片分别生成相似的文本图像切片;
和/或,
所述相似的文本图像切片中文本的文本属性与相应目标文本的文本属性不同,所述相似的文本图像切片的图像属性与相应目标文本的文本图像切片的图像属性不同;
其中,所述文本属性包括语义内容和/或文本字体和/或文本颜色,所述图像属性包括表征图像质量的图像特征和/或表征图像风格的图像特征。
在上述文档图像生成方法的一个技术方案中,所述方法还包括对每个目标文本的文本图像切片分别生成多个相似的文本图像切片,“在所述背景图像中每个目标文本各自对应的图像区域上,将每个目标文本各自对应的相似的文本图像切片与所述背景图像进行图像融合,以生成新的文档图像”的步骤具体包括:
对所有相似的文本图像切片进行多次不放回的随机抽样,每次随机抽样的结果包括每个目标文本各自对应的一个相似的文本图像切片;
针对每次随机抽样的结果,在所述背景图像中每个目标文本各自对应的图像区域上,将当前随机抽样的结果中每个目标文本各自对应的一个相似的文本图像切片与所述背景图像进行图像融合,以生成一个新的文档图像;
和/或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云从科技集团股份有限公司,未经云从科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210122791.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序