[发明专利]字符检测方法、装置、检测设备及存储介质在审
申请号: | 201910262671.8 | 申请日: | 2019-04-02 |
公开(公告)号: | CN111767908A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 张恒瑞;郭明坚;宋翔 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06K9/03 | 分类号: | G06K9/03;G06K9/00 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 检测 方法 装置 设备 存储 介质 | ||
1.一种字符检测方法,其特征在于,包括:
采集待检测图像,并获取所述待检测图像中的字符区域;
对所述字符区域进行字符检测,得到每个字符区域对应的字符,以及每个字符对应的字符置信度;
将每个字符区域对应的字符置信度位于预设阈值范围内的字符,替换为通配符,得到每个字符区域对应的处理后字符;
将每个字符区域对应的处理后字符进行排列组合,得到至少一个组合字符;
根据所述至少一个组合字符从预设字符数据库中确定出目标字符。
2.根据权利要求1所述的字符检测方法,其特征在于,所述采集待检测图像,并获取所述待检测图像中的字符区域包括:
采集多张待检测图像;
将每张待检测图像分别通过第一目标检测网络进行文本定位,得到每张待检测图像对应的文本位置,以及每个文本位置对应的文本置信度;
根据每个文本位置从对应的待检测图像中截取文本区域,得到多个文本区域;
根据每个文本区域和文本置信度,确定每张待检测图像中的字符区域。
3.根据权利要求2所述的字符检测方法,其特征在于,所述根据每个文本区域和文本置信度,确定每张待检测图像中的字符区域包括:
获取每个文本区域的像素面积;
根据所述像素面积和文本置信度,计算每个文本区域对应的评价值;
从多个文本区域中,筛选出评价值较高的前预设个文本区域;
对所述预设个文本区域进行二值化处理,得到每个文本区域对应的二值化图像;
通过第二目标检测网络分别对每张二值化图像进行字符识别,得到字符位置;
根据字符位置从对应的二值化图像中截取字符区域。
4.根据权利要求3所述的字符检测方法,其特征在于,所述对所述预设个文本区域进行二值化处理,得到每个文本区域对应的二值化图像包括:
对预设个文本区域进行尺寸归一化,得到统一尺寸的预设个文本区域;
通过生成式对抗网络对统一尺寸的预设个文本区域进行二值化处理,得到每个文本区域对应的二值化图像。
5.根据权利要求1所述的字符检测方法,其特征在于,所述对所述字符区域进行字符检测,得到每个字符区域对应的字符,以及每个字符对应的字符置信度包括:
获取训练后的深度学习网络GoogleNet;
通过所述训练后的深度学习网络GoogleNet对所述字符区域进行字符检测,得到每个字符区域对应的字符和每个字符对应的字符置信度。
6.根据权利要求1所述的字符检测方法,其特征在于,所述预设阈值范围为大于第一阈值且小于第二阈值,所述将每个字符区域对应的字符置信度位于预设阈值范围内的字符,替换为通配符,得到每个字符区域对应的处理后字符包括:
从每个字符区域对应字符中,筛选出字符置信度较高的前预设个字符;
将每个字符区域对应的预设个字符中,字符置信度小于或等于第一阈值的字符删除,并将大于第一阈值且小于第二阈值的字符替换为通配符,得到每个字符区域对应的处理后字符。
7.根据权利要求1至6任一项所述的字符检测方法,其特征在于,所述根据所述至少一个组合字符从预设字符数据库中确定出目标字符包括:
获取每个字符区域对应的处理后字符的置信度;
根据处理后字符的置信度计算每个组合字符对应的置信度,并筛选出置信度最大的组合字符,得到候选组合字符。
将所述候选组合字符与预设字符数据库中预先存储的字符串进行匹配,并根据匹配结果确定出目标字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910262671.8/1.html,转载请声明来源钻瓜专利网。