[发明专利]一种图像文本检测方法及系统、用户终端及服务器有效
申请号: | 201610921016.5 | 申请日: | 2016-10-21 |
公开(公告)号: | CN107977592B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 刘成林;董振江;陈凯;贾霞;殷飞;陈和香 | 申请(专利权)人: | 中兴通讯股份有限公司;中国科学院自动化研究所 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/18;G06V30/19 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 姜春咸;冯建基 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文本 检测 方法 系统 用户 终端 服务器 | ||
1.一种图像文本检测方法,包括:
计算待识别图像中各像素点在多个不同大小邻区内的显著性值,获取多个显著性图像;
提取所述多个显著性图像中正负显著性连通部件,生成候选文本连通构件;
发送所述候选文本连通构件,接收对所述候选文本连通构件进行无向图处理得到的多个文本行;
对所述多个文本行进行交叠融合,生成图像文本检测结果;
发送所述图像文本检测结果,接收并输出对所述图像文本检测结果进行识别得到的最终文本。
2.如权利要求1所述的图像文本检测方法,其特征在于,所述计算待识别图像中各像素点在多个不同大小邻区内的显著性值,获取多个显著性图像包括:
计算待识别图像中各像素点的颜色值;
计算待识别图像中各像素点在各邻域尺度下邻域窗口内所有像素点的颜色均值;
将所述各像素点的颜色值与各像素点在各邻域尺度下邻域窗口内所有像素点的颜色均值做差,得到所述各像素点在多个不同大小邻区内的显著性值;
根据所述各像素点在多个不同大小邻区内的显著性值,绘制所述多个显著性图像。
3.如权利要求1或2所述的图像文本检测方法,其特征在于,所述提取所述多个显著性图像中正负显著性连通部件,生成候选文本连通构件包括:
针对各显著性图像,分别提取显著性值高于正阀值的像素点构成的连通部件,获得正显著性连通部件;分别提取显著性值低于负阀值的像素点构成的连通部件,获得负显著性连通部件;
将所述正显著性连通部件及所述负显著性连通部件,组合构成所述候选文本连通部件。
4.一种图像文本检测方法,包括:
接收候选文本连通构件,根据所述候选文本连通构件获取文本连通部件;
将所述文本连通部件视作节点,连接近邻节点对构成无向图;
对所述无向图的每一条边提取局部特征和全局特征,利用支持向量机分类判断是否保留边;
将所述无向图中有公共节点的边依次进行融合,获得多个文本行;
发送所述多个文本行,接收对所述多个文本行进行交叠融合生成的图像文本检测结果;
对所述图像文本检测结果进行识别得到最终文本;
发送所述最终文本。
5.如权利要求4所述的图像文本检测方法,其特征在于,所述根据所述候选文本连通构件获取文本连通部件包括:
基于空间包含关系,筛选所述候选文本连通构件中的非文本连通部件,得到所述文本连通部件;和/或,
基于卷积神经网络,筛选所述候选文本连通构件中的非文本连通部件,得到所述文本连通部件。
6.如权利要求4或5所述的图像文本检测方法,其特征在于,所述将所述文本连通部件视作节点,连接近邻节点对构成无向图,将所述无向图中有公共节点的边依次进行融合,从而多个文本行包括:
对所述文本连通部件中的每一节点,将其对应的连通部件外接矩形框的中心点视作其坐标,计算其离其它所有节点的欧式距离,得出与其距离最近的四个节点后,在其与这四个节点间各连一条边,构建所述无向图;
获取所述无向图的每一条边的两端节点间的欧氏距离除以两端节点的外接矩形框周长之和、两端节点中较小的笔划宽度与较大的笔划宽度的比值、两端节点中较小的笔划宽度与较大的笔划宽度的绝对差值、及两端节点的颜色差异值,作为所述无向图的每一条边的局部特征;
获取所述无向图的每一条边的长度与所述无向图中所有边的平均长度的比值、每一条边的长度与无向图中最长边的长度的比值、每一条边的方向与无向图中边的平均方向的差异、无向图中经过各边的直线路径上节点和边的数目、无向图中经过各边第一端点且不经过第二端点的直线路径上节点和边的数目、无向图中经过各边第二端点且不经过第一端点的直线路径上节点和边的数目,作为所述全局特征;
利用支持向量机分类判断是否保留边,将所述无向图中有公共节点的边依次进行融合,获得所述多个文本行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司;中国科学院自动化研究所,未经中兴通讯股份有限公司;中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610921016.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种二维码图像识别方法及移动终端
- 下一篇:图像处理装置和图像处理方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序