[发明专利]文字图像的处理方法和装置、电子设备、计算机存储介质有效
申请号: | 201711039709.2 | 申请日: | 2017-10-30 |
公开(公告)号: | CN108230332B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 张杰;梁鼎 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T5/00;G06N3/08 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 图像 处理 方法 装置 电子设备 计算机 存储 介质 | ||
本发明实施例公开了一种文字图像的处理方法和装置、电子设备、计算机存储介质,其中,方法包括:将接收到的待处理文字图像处理为黑白图像;通过渲染网络对所述黑白图像进行背景渲染,得到渲染后的渲染文字图像;所述渲染网络基于文字图像样本集结合判别网络预先训练获得,所述文字图像样本集包括真实的样本文字图像以及所述真实的样本文字图像经过背景渲染获得的渲染样本文字图像。本发明上述实施例,由于采用训练好的渲染网络,实现了为黑白图像渲染了较为真实的背景纹理,实现了获得与真实图像差异较小的渲染文字图像。
技术领域
本发明涉及图像处理技术,尤其是一种文字图像的处理方法和装置、电子设备、计算机存储介质。
背景技术
基于深度学习的文字识别算法需要大量的样本数据进行训练,通过人工采集和标注这些样本数据需要花费极高的人力成本;同时由于字典中的文字在现实生活中出现的频率差异较大,往往很难采集到一些生僻字的文字图像,这对文字识别算法的训练也会造成一定的影响。因此人工生成用于文字识别的数据不仅可以极大地节省成本,而且也能丰富数据集,训练更好的模型;然而实际采集到的文字图像往往会有不同的背景纹理,文字的模糊程度也不一致,还存在光照、拍摄角度等各种因素影响采集到的文字图像。
发明内容
本发明实施例提供一种文字图像的处理技术。
本发明实施例提供的一种文字图像的处理方法,包括:
将接收到的待处理文字图像处理为黑白图像;
通过渲染网络对所述黑白图像进行背景渲染,得到渲染后的渲染文字图像;所述渲染网络基于文字图像样本集结合判别网络预先训练获得,所述文字图像样本集包括真实样本文字图像以及所述真实样本文字图像经过背景渲染获得的渲染样本文字图像,所述判别网络用于识别接收的文字图像的真实率,所述真实率表示所述渲染文字图像和所述文字图像样本集中的图像是真实图像的概率。
在基于本发明上述方法的另一个实施例中,所述将接收到的待处理文字图像处理为黑白图像,包括:
将接收到的待处理文字图像转换为灰度图,基于所述转换得到的灰度图计算获得自适应阈值;
基于所述自适应阈值对所述灰度图进行二值化处理,得到所述黑白图像。
在基于本发明上述方法的另一个实施例中,基于所述自适应阈值对所述灰度图进行二值化处理,包括:
将所述灰度图中大于或等于所述自适应阈值的像素对应像素值设置为255,将所述灰度图中小于所述自适应阈值的像素对应像素值设置为0;
或将所述灰度图中大于或等于所述自适应阈值的像素对应像素值设置为0,将所述灰度图中小于所述自适应阈值的像素对应像素值设置为255。
在基于本发明上述方法的另一个实施例中,通过渲染网络对所述黑白图像进行背景渲染之前,还包括:
保持所述黑白图像的宽高比不变,对所述黑白图像进行缩放,将所述黑白图像的高度缩放为设定值,将所述黑白图像的宽度缩放为设定值的整数倍。
在基于本发明上述方法的另一个实施例中,将所述黑白图像的宽度缩放为设定像素值的整数倍,包括:
当所述黑白图像经过缩放,得到缩放后的宽度值不为所述设定值的整数倍时,通过反映填充的方式将所述宽度值补全到所述设定值的整数倍。
在基于本发明上述方法的另一个实施例中,所述通过反映填充的方式将所述宽度值补全到所述设定值的整数倍,包括:
从所述经过缩放的黑白图像的最右列像素开始按照从左到右的顺序补充至少1列像素,使补充所述至少1列像素后的宽度值为所述设定值的整数倍;所述至少1列像素包括从所述最右列像素开始从右到左选取的至少1列像素,在补充过程中,将先选取的像素先插入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711039709.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序