[发明专利]文字区域检测方法、装置及存储介质有效
申请号: | 201910344670.8 | 申请日: | 2019-04-26 |
公开(公告)号: | CN110059685B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 吕鹏原;贾佳亚;戴宇荣;沈小勇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/148 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 区域 检测 方法 装置 存储 介质 | ||
1.一种文字区域检测方法,其特征在于,所述方法包括:
基于预设网络模型,获取目标图像的概率图和位置图,所述概率图中每个像素点的像素值表示所述目标图像中对应的像素点属于文字的概率,所述位置图中每个像素点的像素值表示所述目标图像中对应的像素点在所属文字区域中的位置编码,且所述像素点与所属文字区域的中心像素点之间的距离与所述像素点在所属文字区域中的位置编码呈负相关关系;
根据所述概率图和所述位置图中每个像素点的像素值,生成参考图像,所述参考图像中目标像素点的像素值为第一数值,其他像素点的像素值为第二数值,所述目标像素点为所述概率大于第一预设阈值且所述位置编码大于第二预设阈值的像素点;
将所述参考图像中相互连通的目标像素点进行组合,得到所述参考图像中的连通区域,将所述连通区域的轮廓进行放大,得到参考轮廓,且放大幅度与所述第二预设阈值呈正相关关系;
确定所述参考轮廓在所述目标图像中对应的目标轮廓,将所述目标轮廓对应的区域确定为文字区域。
2.根据权利要求1所述的方法,其特征在于,所述基于预设网络模型,获取目标图像的概率图和位置图之前,所述方法还包括:
获取样本图像的样本概率图和样本位置图;
基于所述预设网络模型,获取所述样本图像的测试概率图和测试位置图;
获取所述样本概率图与所述测试概率图之间的误差,以及所述样本位置图与所述测试位置图之间的误差;
根据获取到的误差,对所述预设网络模型的模型参数进行调整,以使基于调整后的预设网络模型获取到的概率图误差和位置图误差收敛。
3.根据权利要求2所述的方法,其特征在于,所述获取样本图像的样本位置图,包括:
获取模板位置图,所述模板位置图中包括按照预设规则确定的多个参考像素点,且所述模板位置图中每个像素点的像素值表示所述每个像素点在所述模板位置图中的位置编码,所述像素点与所述模板位置图的中心像素点之间的距离与所述像素点在所述模板位置图中的位置编码呈负相关关系;
按照所述预设规则,确定所述样本图像中的多个控制像素点;
根据所述多个参考像素点在所述模板位置图中的坐标,以及所述多个控制像素点在所述样本图像中的坐标进行插值运算,得到所述模板位置图与所述样本图像之间的映射关系;
对于所述样本图像中的每个指定像素点,根据所述映射关系确定所述指定像素点在所述模板位置图中的映射像素点,将所述映射像素点在所述模板位置图中的位置编码确定为所述指定像素点在所述样本图像中的位置编码;
根据所述样本图像中的每个像素点的位置编码,生成所述样本位置图。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对于所述模板位置图中的每个指定像素点,根据所述模板位置图的尺寸、所述指定像素点的坐标和所述模板位置图的中心像素点的坐标,采用以下公式,获取所述指定像素点的位置编码:
其中,v表示所述指定像素点在所述模板位置图中的位置编码,x表示所述指定像素点的横坐标,y表示所述指定像素点的纵坐标,xc表示所述中心像素点的横坐标,yc表示所述中心像素点的纵坐标,w表示所述模板位置图的宽度,h表示所述模板位置图的高度。
5.根据权利要求1所述的方法,其特征在于,所述根据所述概率图和所述位置图中每个像素点的像素值,生成参考图像,包括:
对所述概率图进行二值化处理,得到第一图像,以使所述第一图像中所述概率大于所述第一预设阈值的像素点的像素值为第三数值,所述概率不大于所述第一预设阈值的像素点的像素值为0;
对所述位置图进行二值化处理,得到第二图像,以使所述第二图像中所述位置编码大于所述第二预设阈值的像素点的像素值为第四数值,所述位置编码不大于所述第二预设阈值的像素点的像素值为0;
将所述第一图像与所述第二图像进行乘法处理,得到所述参考图像,所述第三数值与所述第四数值的乘积为所述第一数值,所述第二数值为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910344670.8/1.html,转载请声明来源钻瓜专利网。