[发明专利]在图像中检测文本的方法、装置、介质及电子设备有效
申请号: | 201810213160.2 | 申请日: | 2018-03-15 |
公开(公告)号: | CN108446698B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 李玉梅;杨学行 | 申请(专利权)人: | 腾讯大地通途(北京)科技有限公司;腾讯科技(深圳)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/20;G06T5/50;G06T7/536 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 100086 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 检测 文本 方法 装置 介质 电子设备 | ||
1.一种在图像中检测文本的方法,其特征在于,包括:
获取待处理图像;
对所述待处理图像进行透视变换处理,以将所述待处理图像调整为正视图,得到处理后的校正图像;
基于所述校正图像,生成多张不同尺寸的图像;
分别检测所述多张不同尺寸的图像中的文本,以得到所述多张不同尺寸的图像中的文本检测框;
根据所述多张不同尺寸的图像与所述校正图像之间的尺寸关系,将所述多张不同尺寸的图像中的文本检测框映射到所述校正图像中,得到多个文本检测框;
根据所述多个文本检测框之间的位置关系,对所述多个文本检测框进行融合处理,得到融合处理后的文本检测框;
将所述融合处理后的文本检测框中包含的文本行作为在所述校正图像中检测到的文本行;
其中,根据所述多个文本检测框之间的位置关系,对所述多个文本检测框进行融合处理,包括:
若所述多个文本检测框中任两个文本检测框的重叠面积与所述任两个文本检测框中的一个文本检测框的面积之间的比例超过第一预定值,则生成所述任两个文本检测框的最小外接矩形,将所述任两个文本检测框的最小外接矩形作为所述任两个文本检测框的融合结果;
若所述多个文本检测框中任两个文本检测框的方向一致,且所述任两个文本检测框的重叠面积与所述任两个文本检测框中的一个文本检测框的面积之间的比例超过第二预定值,则将所述任两个文本检测框的最小外接矩形作为所述任两个文本检测框的融合结果;
其中,所述第一预定值大于所述第二预定值。
2.根据权利要求1所述的在图像中检测文本的方法,其特征在于,对所述待处理图像进行透视变换处理,包括:
构建透视变换矩阵;
根据所述透视变换矩阵,对所述待处理图像进行透视变换处理。
3.根据权利要求2所述的在图像中检测文本的方法,其特征在于,构建透视变换矩阵,包括:
检测所述待处理图像中的直线段;
从检测到的直线段中选取出符合条件的目标直线段;
确定所述目标直线段所在的直线能够组成的面积最大的四边形;
生成所述四边形对应的矩形框;
根据所述四边形的各个顶点与所述矩形框的各个顶点的对应关系,构建所述透视变换矩阵。
4.根据权利要求3所述的在图像中检测文本的方法,其特征在于,检测所述待处理图像中的直线段,包括:
确定所述待处理图像中的各个像素点与水平线的夹角,并合并所述夹角的差值在预定范围内的像素点,得到至少一个区域;
生成各个所述区域的最小外接矩形;
针对各个所述区域,选取所述夹角与所述最小外接矩形的主方向的角度差小于或等于预定值的目标像素点;
根据各个所述区域的最小外接矩形内的像素点个数和所述目标像素点的个数,确定各个所述区域是否为直线段。
5.根据权利要求3所述的在图像中检测文本的方法,其特征在于,从检测到的直线段中选取出符合条件的目标直线段,包括:
从检测到的直线段中过滤掉长度小于或等于预定长度的直线段,和/或过滤掉与竖直方向和/或水平方向的夹角大于或等于预定角度的直线段,以得到所述目标直线段。
6.根据权利要求3所述的在图像中检测文本的方法,其特征在于,生成所述四边形对应的矩形框,包括:
以所述四边形的两个不相邻的顶点作为所述矩形框的两个不相邻的顶点,生成所述矩形框。
7.根据权利要求1所述的在图像中检测文本的方法,其特征在于,根据所述多个文本检测框之间的位置关系,对所述多个文本检测框进行融合处理,还包括:
若所述多个文本检测框中任两个文本检测框相互包含,则将所述任两个文本检测框进行融合。
8.根据权利要求7所述的在图像中检测文本的方法,其特征在于,将所述任两个文本检测框进行融合,包括:
生成所述任两个文本检测框的最小外接矩形,将所述任两个文本检测框的最小外接矩形作为所述任两个文本检测框的融合结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯大地通途(北京)科技有限公司;腾讯科技(深圳)有限公司,未经腾讯大地通途(北京)科技有限公司;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810213160.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序