[发明专利]一种应用于图像旋转的图像保真的方法及装置有效
申请号: | 201810803980.7 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109034153B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 马文伟;王强 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06V10/24 | 分类号: | G06V10/24;G06V30/194;G06T5/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 图像 旋转 保真 方法 装置 | ||
本发明实施例公开了一种应用于图像旋转的图像保真的方法及装置,首先确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形,然后确定未知像素值区域,所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域,根据所述目标外接矩形与未知像素区域的位置关系,确定保真边界,最后根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。该方法及装置将旋转后引入的未知像素值区域截取在保真图像之外,获取保真样本图像,可继续用于扩充训练样本数量,丰富样本特征,提高深度学习算法模型的识别和泛化能力。
技术领域
本发明涉及数据增强技术,更具体的说,是涉及一种应用于图像旋转的图像保真的方法及装置。
背景技术
深度学习是机器学习中一种基于对数据进行表征学习的方法。目前,深度学习技术已经逐渐应用到各领域,在各行业发挥重要作用。
将深度学习应用到OCR(Optical Character Recognition,光学字符识别) 领域,检测图像中的文字区域及识别文字内容,也是目前深度学习的一个应用方向。然而,由于没有大规模可用的文字检测识别数据集,且获取大量带标注的训练数据成本高,因此需要采用计算机视觉领域的数据增强技术对图像进行旋转、平移、缩放、加噪、模糊等几种操作及组合,生成大量样本,使得机器学习模型具备强大的识别和泛化能力。例如,图1示出了一张用于身份识别的文字样本经过数据增强生成七张训练图像,依次为原始图像、旋转图像、平移图像、放大图像、模糊图像、加噪图像、旋转模糊图像和旋转加噪图像。
图像旋转是数据增强技术的关键部分,然而,现有技术中,图像旋转后通常会引入一些未知像素值,如图1(b)所示,图像旋转后重要信息区域(文本信息)外接矩形包含未知像素值,即黑色填充区域。这就导致旋转后的图像失真,影响深度学习模型的训练。目前图像旋转引入的未知像素值区域如何处理尚无很好的解决方案。
发明内容
有鉴于此,本发明提供了一种应用于图像旋转的图像保真的方法及装置,以克服现有技术中图像旋转引入未知像素值而导致的图像失真的问题。
为实现上述目的,本发明提供如下技术方案:
一种应用于图像旋转的图像保真的方法,包括:
确定样本图像旋转后的关键信息区域的最小外接矩形为目标外接矩形;
确定未知像素值区域,所述未知像素值区域为所述样本图像旋转后在其旋转前的图像区域中没有图像显示内容的区域;
根据所述目标外接矩形与所述未知像素区域的位置关系,确定保真边界;
根据确定的保真边界截取旋转后的所述关键信息区域图像作为保真样本图像。
可选的,所述根据所述目标外接矩形与未知像素区域的位置关系,确定保真边界,包括:
判断所述目标外接矩形是否与所述未知像素区域重叠;
根据所述目标外接矩形与所述未知像素区域的重叠情况,确定保真边界。
可选的,所述根据所述目标外接矩形与所述未知像素区域的重叠情况,确定保真边界,包括:
在所述目标外接矩形与所述未知像素区域存在重叠时,确定最小外接矩形不与所述未知像素区域重叠的关键信息区域,并将所述最小外接矩形的边界确定为保真边界;
在所述目标外接矩形与所述未知像素区域不存在重叠时,将所述目标外接矩形的边界确定为保真边界。
可选的,所述判断所述目标外接矩形是否与所述未知像素区域重叠,包括:
判断所述目标外接矩形分别在上、下、左、右四个方向上是否与所述未知像素值区域重叠。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810803980.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序