[发明专利]文档图像的处理方法及装置、训练样本的生成方法及装置在审
申请号: | 202010479951.7 | 申请日: | 2020-05-29 |
公开(公告)号: | CN113744172A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 彭鑫;刘坚强;吴鹏杰 | 申请(专利权)人: | 北京小米松果电子有限公司 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T7/11;G06T7/136;G06T5/30;G06T11/40 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 处理 方法 装置 训练 样本 生成 | ||
1.一种文档图像的处理方法,其特征在于,所述处理方法包括:
确定待处理文档图像中字符所在的初始字符区域;
对所述初始字符区域进行优化,确定所述字符的边界,并根据所述字符的边界确定优化后的目标字符区域;
从所述待处理文档图像中剔除所述目标字符区域,并根据剔除了所述目标字符区域的待处理文档图像生成光照图像,所述光照图像用于反映环境的光照信息。
2.如权利要求1所述的文档图像的处理方法,其特征在于,确定所述待处理文档图像中的初始字符区域,包括:
对所述待处理文档图像进行二值化处理,得到二值图像,并从所述二值图像中识别出所述初始字符区域;
或,将所述待处理文档图像中所述字符所在的区域进行二值化处理,并将经过二值化处理的区域确定为所述初始字符区域。
3.如权利要求1或2所述的文档图像的处理方法,其特征在于,对所述初始字符区域进行优化,包括:
基于形态学算法对所述初始字符区域进行优化。
4.如权利要求1所述的文档图像的处理方法,其特征在于,根据剔除了所述目标字符区域的待处理文档图像生成光照图像,包括:
对于空白区域中的每个像素点,基于插值算法拟合距离所述像素点预设范围内的相邻像素点的像素值,并将所述像素值填充于所述像素点处,所述空白区域为所述待处理文档图像中剔除了所述目标字符区域的区域;
将经过像素值填充的待处理文档图像确定为所述光照图像。
5.如权利要求1所述的文档图像的处理方法,其特征在于,所述待处理文档图像中背景区域的像素值与所述待处理文档图像中字符区域的像素值之差大于像素阈值。
6.一种训练样本的生成方法,其特征在于,所述生成方法包括:
获取文档图像样本;
将光照图像叠加于所述文档图像样本上,得到叠加图像,所述光照图像由权利要求1-5中任一项所述的文档图像的处理方法获得;
将所述叠加图像和所述光照图像作为模型训练的训练样本对,所述模型用于消除输入的文档图像中的光照信息。
7.如权利要求6所述的训练样本的生成方法,其特征在于,所述文档图像样本包括以下至少之一:
由电子文档转换得到的第一文档图像;
对所述第一文档图像进行空间几何变换得到的第二文档图像。
8.一种文档图像的处理装置,其特征在于,所述处理装置包括:
确定模块,用于确定待处理文档图像中字符所在的初始字符区域;
优化模块,用于对所述初始字符区域进行优化,确定所述字符的边界,并根据所述字符的边界确定优化后的目标字符区域;
生成模块,用于从所述待处理文档图像中剔除所述目标字符区域,并根据剔除了所述目标字符区域的待处理文档图像生成光照图像,所述光照图像用于反映环境的光照信息。
9.如权利要求8所述的文档图像的处理装置,其特征在于,在对所述初始字符区域进行优化时,所述优化模块用于:
对所述待处理文档图像进行二值化处理,得到二值图像,并从所述二值图像中识别出所述初始字符区域;
或,将所述待处理文档图像中所述字符所在的区域进行二值化处理,并将经过二值化处理的区域确定为所述初始字符区域。
10.如权利要求8所述的文档图像的处理装置,其特征在于,在根据剔除了所述目标字符区域的待处理文档图像生成光照图像时,所述生成模块用于:
对于空白区域中的每个像素点,基于插值算法拟合距离所述像素点预设范围内的相邻像素点的像素值,并将所述像素值填充于所述像素点处,所述空白区域为所述待处理文档图像中剔除了所述目标字符区域的区域;
将经过像素值填充的待处理文档图像确定为所述光照图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米松果电子有限公司,未经北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010479951.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:智能控温的网络交换机
- 下一篇:检测肝肿瘤组织豪猪音配体的方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序