[发明专利]文字区域检测方法、装置及存储介质有效
申请号: | 201910344670.8 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110059685B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 吕鹏原;贾佳亚;戴宇荣;沈小勇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/148 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 区域 检测 方法 装置 存储 介质 | ||
本发明公开了一种文字区域检测方法、装置及存储介质,属于图像处理领域。方法包括:基于预设网络模型,获取待检测的目标图像的概率图和位置图,且位置编码与像素点与所属文字区域的中心点之间的距离呈负相关关系;根据概率图和位置图中每个像素点的像素值,生成参考图像;将参考图像中相互连通的目标像素点进行组合,得到参考图像中的连通区域,将连通区域的轮廓进行放大,得到参考轮廓;确定参考轮廓在目标图像中对应的目标轮廓,将目标轮廓对应的区域确定为文字区域。区分出不同文字所属的文字区域,防止出现将相互连接的文字划分至同一个文字区域的情况,减小了文字连接对文字区域检测造成的影响,提高文字区域的准确率,提升了检测效果。
技术领域
本发明涉及图像处理领域,特别涉及一种文字区域检测方法、装置及存储介质。
背景技术
随着图像处理技术的快速发展和日常生活中图像的广泛传播,文字识别技术已成为一种常用的图像处理技术,通过文字识别能够识别图像中的文字,更加深入地理解图像的语义信息。而文字区域检测是文字识别的关键步骤,只有准确地检测出图像中的文字区域,才能准确地识别文字区域中的文字。
相关技术中提出了一种利用网络模型进行文字区域检测的方式,参见图1,获取网络模型,该网络模型用于获取任一图像中的每个像素点属于文字的概率。则基于该网络模型,获取目标图像中每个像素点属于文字的概率,从而根据每个像素点属于文字的概率,区分开目标图像中的文字像素点和非文字像素点,根据目标图像中的文字像素点确定文字区域。
目标图像中可能会存在连接在一起的文字,采用上述方案难以将连接在一起的文字区分开来,很容易将这些文字划分至同一个文字区域,准确率低下,检测效果不佳。
发明内容
本发明实例提供了一种文字区域检测方法、装置及存储介质,解决了相关技术存在的问题。所述技术方案如下:
一方面,提供了一种文字区域检测方法,所述方法包括:
基于预设网络模型,获取目标图像的概率图和位置图,所述概率图中每个像素点的像素值表示所述目标图像中对应的像素点属于文字的概率,所述位置图中每个像素点的像素值表示所述目标图像中对应的像素点在所属文字区域中的位置编码,且所述像素点与所属文字区域的中心像素点之间的距离与所述像素点在所属文字区域中的位置编码呈负相关关系;
根据所述概率图和所述位置图中每个像素点的像素值,生成参考图像,所述参考图像中目标像素点的像素值为第一数值,其他像素点的像素值为第二数值,所述目标像素点为所述概率大于第一预设阈值且所述位置编码大于第二预设阈值的像素点;
将所述参考图像中相互连通的目标像素点进行组合,得到所述参考图像中的连通区域,将所述连通区域的轮廓进行放大,得到参考轮廓,且放大幅度与所述第二预设阈值呈正相关关系;
确定所述参考轮廓在所述目标图像中对应的目标轮廓,将所述目标轮廓对应的区域确定为文字区域。
另一方面,提供了一种文字区域检测装置,所述装置包括:
第一获取模块,用于基于预设网络模型,获取目标图像的概率图和位置图,所述概率图中每个像素点的像素值表示所述目标图像中对应的像素点属于文字的概率,所述位置图中每个像素点的像素值表示所述目标图像中对应的像素点在所属文字区域中的位置编码,且所述像素点与所属文字区域的中心像素点之间的距离与所述像素点在所属文字区域中的位置编码呈负相关关系;
生成模块,用于根据所述概率图和所述位置图中每个像素点的像素值,生成参考图像,所述参考图像中目标像素点的像素值为第一数值,其他像素点的像素值为第二数值,所述目标像素点为所述概率大于第一预设阈值且所述位置编码大于第二预设阈值的像素点;
区域组合模块,用于将所述参考图像中相互连通的目标像素点进行组合,得到所述参考图像中的连通区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910344670.8/2.html,转载请声明来源钻瓜专利网。