[发明专利]一种图像文本的识别方法和装置有效
申请号: | 201610179262.8 | 申请日: | 2016-03-25 |
公开(公告)号: | CN107229932B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 毛旭东;施兴;褚崴;程孟力;周文猛 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/40 | 分类号: | G06K9/40;G06K9/42;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文本 识别 方法 装置 | ||
1.一种图像文本的识别方法,其特征在于,包括:
获取待识别的图像,所述图像包括多个像素点;
根据所述多个像素点,确定所述图像的第一文本区域;所述第一文本区域为经过初步筛选而确定的包括文本信息的区域;
按照预设规则,从所述第一文本区域中提取出第二文本区域;所述第一文本区域包括基于第二文本区域像素点确定的多个连通区域;所述第二文本区域包括所述多个连通区域中满足所述预设规则的连通区域;所述满足所述预设规则的连通区域包括面积大于或等于2*2的连通区域,以及,离所述多个连通区域中最大连通区域的距离小于或等于0.06的连通区域;
对所述第二文本区域进行识别;
其中,在所述按照预设规则,从所述第一文本区域中提取出第二文本区域的步骤前,还包括:
对所述第一文本区域进行二值化处理;
所述对所述第一文本区域进行二值化处理的步骤包括:
分别判断所述第一文本区域中的多个像素点的映射像素值是否大于第二预设阈值;
若是,则将所述像素点标记为第二背景区域像素点;
若否,则将所述像素点标记为第二文本区域像素点。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个像素点,确定所述图像的第一文本区域的步骤包括:
针对所述多个像素点,计算所述图像的直方图,所述直方图具有对应的多个特征值;
根据所述多个特征值,对所述直方图进行对比度归一化处理,获得对比度归一化处理结果;
对所述对比度归一化处理结果进行二值化处理,获得所述图像的第一文本区域。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个特征值,对所述直方图进行对比度归一化处理,获得对比度归一化处理结果的步骤包括:
按比例调整所述多个特征值,使调整后的多个特征值的和为特定数值;
采用累积分布函数对所述调整后的多个特征值进行变换,获得变换后的多个特征值;
分别将所述变换后的多个特征值映射到所述多个像素点,获得所述多个像素点的映射像素值。
4.根据权利要求3所述的方法,其特征在于,所述对所述对比度归一化处理结果进行二值化处理,获得所述图像的第一文本区域的步骤包括:
分别判断所述图像中的多个像素点的映射像素值是否大于第一预设阈值;
若是,则将所述像素点标记为第一背景区域像素点;
若否,则将所述像素点标记为第一文本区域像素点;
从所述图像中提取出包含全部第一文本区域像素点的面积最小的外接矩形。
5.根据权利要求1所述的方法,其特征在于,所述按照预设规则,从所述第一文本区域中提取出第二文本区域的步骤包括:
确定所述第一文本区域中的多个连通区域;
分别判断所述多个连通区域是否满足预设规则;
若是,则提取出相对应的多个连通区域作为第二文本区域。
6.根据权利要求5所述的方法,其特征在于,所述确定所述第一文本区域中的多个连通区域的步骤包括:
遍历所述第二文本区域像素点;
将当前第二文本区域像素点与相邻的第二文本区域像素点相连,获得以第二文本区域像素点为顶点的多边形;
将包含所述多边形的面积最小的外接矩形确定为连通区域。
7.根据权利要求1或2或3或4或5或6所述的方法,其特征在于,所述对所述第二文本区域进行识别的步骤包括:
采用卷积神经网络CNN汉字识别模型对所述第二文本区域进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610179262.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序