[发明专利]电话号码的检测及识别方法、装置及存储介质有效
申请号: | 201811640552.3 | 申请日: | 2018-12-29 |
公开(公告)号: | CN111382734B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 王超;赵锟;姜帆 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V30/194;G06N3/04 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电话号码 检测 识别 方法 装置 存储 介质 | ||
本公开涉及电话号码的检测及识别方法、装置及存储介质。该电话号码的检测及识别方法包括:检测目标图像中的电话号码候选区域;对所述电话号码候选区域进行校正,得到待识别区域;确定所述待识别区域所属的类别;在所述待识别区域所属的类别为电话号码类别的情况下,对所述待识别区域进行识别,得到所述待识别区域对应的候选电话号码以及所述候选电话号码对应的概率;根据电话号码的标准结构信息,以及所述候选电话号码对应的概率,确定所述目标图像对应的电话号码识别结果。本公开能够避免对非电话号码的区域进行识别,能够避免漏掉电话号码的边缘数字或者外扩包含过多背景,从而能够提高电话号码识别的准确率及有效性。
技术领域
本公开涉及图像识别技术领域,尤其涉及一种电话号码的检测及识别方法、装置及存储介质。
背景技术
电话号码大量地出现在人们生活的周围,比如信封、快递包裹和商店门匾等。自动检测并识别图像中的电话号码是图像识别技术的一个重要应用。
目前,深度学习算法在图像处理的各个方面得到了广泛应用。在众多应用场景中,深度学习算法的效果优于传统的图像算法。近几年,目标检测领域出现了Faster R-CNN(Faster Region-based Convolutional Neural Networks,更快速的基于区域的卷积神经网络)、YOLO(You Only Look Once,你只需要看一眼)和R-FCN(Region-based FullyConvolutional Networks,基于区域的全卷积网络)等性能较优的技术,也有众多基于它们的改进版本,其可以应用于电话号码区域的检测。相关技术中,在检测过程中,可以通过优化多尺寸和多宽高比的基准框,来提升Faster R-CNN或者YOLO的检测性能。然而,实际中检测得到的矩形框并不利于后期的识别任务,导致相关技术中电话号码的检测及识别的准确性较低。
发明内容
有鉴于此,本公开提出了一种电话号码的检测及识别方法、装置及存储介质。
根据本公开的一方面,提供了一种电话号码的检测及识别方法,包括:
检测目标图像中的电话号码候选区域;
对所述电话号码候选区域进行校正,得到待识别区域;
确定所述待识别区域所属的类别;
在所述待识别区域所属的类别为电话号码类别的情况下,对所述待识别区域进行识别,得到所述待识别区域对应的候选电话号码以及所述候选电话号码对应的概率;
根据电话号码的标准结构信息,以及所述候选电话号码对应的概率,确定所述目标图像对应的电话号码识别结果。
在一种可能的实现方式中,检测目标图像中的电话号码候选区域,包括:
通过候选区域网络检测所述目标图像中的候选区域;
通过基于区域的卷积神经网络的分类层确定所述候选区域所属的类别;
将所属的类别为电话号码类别的候选区域确定为所述电话号码候选区域。
在一种可能的实现方式中,对所述电话号码候选区域进行校正,得到待识别区域,包括:
按照指定比例扩大所述电话号码候选区域,得到外扩区域;
通过基于区域的卷积神经网络的回归层确定所述外扩区域中电话号码区域的最小外接四边形的四个端点;
根据所述外扩区域中电话号码区域的最小外接四边形的四个端点,确定待识别区域。
在一种可能的实现方式中,确定所述待识别区域所属的类别,包括:
采用二分类网络确定所述待识别区域所属的类别,其中,所述二分类网络根据正样本,以及需要过滤的负样本训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811640552.3/2.html,转载请声明来源钻瓜专利网。