[发明专利]文字图像的处理方法和装置、电子设备、计算机存储介质有效
申请号: | 201711039709.2 | 申请日: | 2017-10-30 |
公开(公告)号: | CN108230332B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 张杰;梁鼎 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T5/00;G06N3/08 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 图像 处理 方法 装置 电子设备 计算机 存储 介质 | ||
1.一种文字图像的处理方法,其特征在于,包括:
将接收到的待处理文字图像处理为黑白图像;
通过渲染网络对所述黑白图像进行背景渲染,得到渲染后的渲染文字图像;所述渲染网络基于文字图像样本集结合判别网络预先训练获得,所述文字图像样本集包括真实样本文字图像以及所述真实样本文字图像经过背景渲染获得的渲染样本文字图像,所述判别网络用于识别接收的文字图像的真实率,所述真实率表示所述渲染文字图像和所述文字图像样本集中的图像是真实图像的概率;
将所述得到的渲染文字图像作为样本图像;或将所述得到的渲染文字图像和真实文字图像作为样本图像;
基于所述样本图像训练文字识别网络;所述文字识别网络用于识别样本图像中的文字内容。
2.根据权利要求1所述的方法,其特征在于,所述将接收到的待处理文字图像处理为黑白图像,包括:
将接收到的待处理文字图像转换为灰度图,基于所述转换得到的灰度图计算获得自适应阈值;
基于所述自适应阈值对所述灰度图进行二值化处理,得到所述黑白图像。
3.根据权利要求2所述的方法,其特征在于,基于所述自适应阈值对所述灰度图进行二值化处理,包括:
将所述灰度图中大于或等于所述自适应阈值的像素对应像素值设置为255,将所述灰度图中小于所述自适应阈值的像素对应像素值设置为0;
或将所述灰度图中大于或等于所述自适应阈值的像素对应像素值设置为0,将所述灰度图中小于所述自适应阈值的像素对应像素值设置为255。
4.根据权利要求1所述的方法,其特征在于,通过渲染网络对所述黑白图像进行背景渲染之前,还包括:
保持所述黑白图像的宽高比不变,对所述黑白图像进行缩放,将所述黑白图像的高度缩放为设定值,将所述黑白图像的宽度缩放为设定值的整数倍。
5.根据权利要求4所述的方法,其特征在于,将所述黑白图像的宽度缩放为设定像素值的整数倍,包括:
当所述黑白图像经过缩放,得到缩放后的宽度值不为所述设定值的整数倍时,通过反映填充的方式将所述宽度值补全到所述设定值的整数倍。
6.根据权利要求5所述的方法,其特征在于,所述通过反映填充的方式将所述宽度值补全到所述设定值的整数倍,包括:
从所述经过缩放的黑白图像的最右列像素开始按照从左到右的顺序补充至少1列像素,使补充所述至少1列像素后的宽度值为所述设定值的整数倍;所述至少1列像素包括从所述最右列像素开始从右到左选取的至少1列像素,在补充过程中,将先选取的像素先插入。
7.根据权利要求1-6任一所述的方法,其特征在于,还包括:
将所述渲染文字图像和所述接收到的待处理文字图像输入判别网络;
经所述判别网络输出所述渲染文字图像和所述接收到的待处理文字图像的真实率;
基于所述真实率获取所述渲染文字图像与所述接收到的待处理文字图像之间的误差值;所述误差值表示所述渲染文字图像与所述接收到的待处理文字图像在像素值上的差异;
基于所述误差值训练所述渲染网络和所述判别网络,直到满足预设停止训练条件。
8.根据权利要求7所述的方法,其特征在于,经所述判别网络输出所述渲染文字图像的真实率,包括:
对所述渲染文字图像基于高度和宽度分解为至少一个渲染区域,基于所述判别网络输出分别对应各所述渲染区域的区域真实率;对各所述区域真实率求平均,获取对应所述渲染文字图像的真实率。
9.根据权利要求8所述的方法,其特征在于,各所述渲染区域大小相同,所述渲染区域的高度和宽度相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711039709.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序