[发明专利]一种图像文本检测方法及系统、用户终端及服务器有效
申请号: | 201610921016.5 | 申请日: | 2016-10-21 |
公开(公告)号: | CN107977592B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 刘成林;董振江;陈凯;贾霞;殷飞;陈和香 | 申请(专利权)人: | 中兴通讯股份有限公司;中国科学院自动化研究所 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/18;G06V30/19 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 姜春咸;冯建基 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 文本 检测 方法 系统 用户 终端 服务器 | ||
本发明实施例提供了一种图像文本检测方法及系统、用户终端及服务器;该方法包括:用户终端获取多个显著性图像,生成候选文本连通构件;服务器根据候选文本连通构件获取文本连通部件,将文本连通部件视作节点,连接近邻节点对构成无向图,对无向图中有公共节点的边依次进行融合,获得多个文本行;用户终端对多个文本行进行交叠融合,生成图像文本检测结果;服务器对图像文本检测结果进行识别得到最终文本;用户终端输出最终文本。本发明通过基于显著性模型的文件检测和根据无向图每条边的局部特征和全局特征进行分类得到文本行,提高了图像文本检测效率,降低了计算复杂度。
技术领域
本发明涉及文字识别领域,尤其涉及一种图像文本检测方法及系统、用户终端及服务器。
背景技术
随着数字图像采集设备的快速普及,以及智能无线通讯设备和网络与人们生活之间关系日益密切,互联网上的文本和图像数据呈现爆炸式增长。这些数据在给人们的生活和工作带来丰富的信息和巨大便利的同时,数据的海量性、异构混杂和真伪难辨等特点也给人们有效利用信息带来巨大的困扰。
人们迫切期望对图像中包含的对象、事件以及它们之间的关系等高层语义信息进行分析,从而完成基于内容的图像检索、分类、推荐、过滤等功能。网络上存在的文档图像又以合成文档图像数量最多,主要是网络用户出于各种目的把文本嵌入图片生成的图像,如微信短文图片、长微博和广告图片等人工合成图片。
如何对网络上包含有大量信息的人工合成文档图像进行分析、检测和识别是各大通信企业必须面临的一个新的挑战。
发明内容
本发明实施例提供了一种图像文本检测方法及系统、用户终端及服务器,以提供一种图像文本检测方法。
一方面,提供了一种图像文本检测方法,包括:
计算待识别图像中各像素点在多个不同大小邻区内的显著性值,获取多个显著性图像;
提取多个显著性图像中正负显著性连通部件,生成候选文本连通构件;
发送候选文本连通构件,接收对候选文本连通构件进行无向图处理得到的多个文本行;
对多个文本行进行交叠融合,生成图像文本检测结果;
发送图像文本检测结果,接收并输出对图像文本检测结果进行识别得到的最终文本。
一方面,提供了一种图像文本检测方法,包括:
接收候选文本连通构件,根据候选文本连通构件获取文本连通部件;
将文本连通部件视作节点,连接近邻节点对构成无向图;
对无向图的每一条边提取局部特征和全局特征,利用支持向量机分类判断是否保留边;
将无向图中有公共节点的边依次进行融合,获得多个文本行;
发送多个文本行,接收对多个文本行进行交叠融合生成的图像文本检测结果;
对图像文本检测结果进行识别得到最终文本;
发送最终文本。
一方面,提供了一种图像文本检测方法,包括:
用户终端计算待识别图像中各像素点在多个不同大小邻区内的显著性值,获取多个显著性图像;提取多个显著性图像中正负显著性连通部件,生成候选文本连通构件;发送候选文本连通构件至服务器;
服务器接收候选文本连通构件,根据候选文本连通构件获取文本连通部件;将文本连通部件视作节点,连接近邻节点对构成无向图;对无向图的每一条边提取局部特征和全局特征,利用支持向量机分类判断是否保留边;将无向图中有公共节点的边依次进行融合,获得多个文本行;发送多个文本行至用户终端;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司;中国科学院自动化研究所,未经中兴通讯股份有限公司;中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610921016.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种二维码图像识别方法及移动终端
- 下一篇:图像处理装置和图像处理方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序