[发明专利]一种文本检测方法、装置和计算机设备有效
申请号: | 201910188639.X | 申请日: | 2019-03-13 |
公开(公告)号: | CN111695377B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 王杰;李明键;钮毅 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/18;G06V30/19;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 方法 装置 计算机 设备 | ||
1.一种文本检测方法,其特征在于,所述方法包括:
从包含文本的待检测图像中获取指定信息;所述指定信息包括从所述待检测图像中定位出的候选文本区域的特征向量;
将所述指定信息输入到预先建立的用于构建图像中的文本与关注目标之间的空间关系的目标神经网络,由所述目标神经网络输出空间信息;其中,所述关注目标包括所述图像中的文本、所述图像中与所述文本存在空间关系的指定目标和所述图像的属性信息中的至少一项;所述空间信息包括所述候选文本区域的置信度、所述待检测图像中的文本疑似区域的位置概率图、所述候选文本区域修正后的位置坐标中的至少一项;
依据所述空间信息对所述候选文本区域进行校正,得到所述待检测图像中的终选文本区域。
2.根据权利要求1所述的方法,其特征在于,所述将所述指定信息输入到预先建立的用于构建图像中的文本与关注目标之间的空间关系的目标神经网络,由所述目标神经网络输出空间信息,包括:
将所述指定信息输入到所述目标神经网络中的第一神经网络,由所述第一神经网络对所述指定信息进行处理,输出所述候选文本区域的置信度和所述待检测图像中的文本疑似区域的位置概率图;
将所述候选文本区域的置信度和所述位置概率图确定为所述空间信息。
3.根据权利要求1所述的方法,其特征在于,所述指定信息还包括从所述待检测图像中定位出的与所述候选文本区域存在空间关系的指定目标的特征向量;所述将所述指定信息输入到预先建立的用于构建图像中的文本与关注目标之间的空间关系的目标神经网络,由所述目标神经网络输出空间信息,包括:
将所述指定信息输入到所述目标神经网络中的第二神经网络,由所述第二神经网络的对所述指定信息进行处理,输出所述候选文本区域的置信度和所述待检测图像中的文本疑似区域的位置概率图;
将所述候选文本区域的置信度和所述位置概率图确定为所述空间信息。
4.根据权利要求1所述的方法,其特征在于,所述指定信息还包括所述待检测图像的属性信息;所述将所述指定信息输入到预先建立的用于构建图像中的文本与关注目标之间的空间关系的目标神经网络,由所述目标神经网络输出空间信息,包括:
将所述指定信息输入到用于所述目标神经网络中的第三神经网络,由所述第三神经网络的对所述指定信息处理,输出所述候选文本区域修正后的位置坐标;
将所述候选文本区域修正后的位置坐标确定为所述空间信息。
5.根据权利要求1所述的方法,其特征在于,所述指定信息还包括从所述待检测图像中定位出的与所述候选文本区域存在空间关系的指定目标的特征向量和所述待检测图像的属性信息;所述将所述指定信息输入到预先建立的用于构建图像中的文本与关注目标之间的空间关系的目标神经网络,由所述目标神经网络输出空间信息,包括:
将所述指定信息输入到所述目标神经网络中的第四神经网络,由所述第四神经网络对所述指定信息进行处理,输出所述候选文本区域的置信度、所述候选文本区域修正后的位置坐标和所述待检测图像中的文本疑似区域的位置概率图;
将所述候选文本区域的置信度、所述候选文本区域修正后的位置坐标和所述位置概率图确定为所述空间信息。
6.根据权利要求2、3、5任一项所述的方法,其特征在于,所述依据所述空间信息对所述候选文本区域进行校正,得到所述待检测图像中的终选文本区域,包括:
依据所述位置概率图,确定第一备选文本区域和所述第一备选文本区域的置信度;
判断所述位置概率图中所述候选文本区域对应的概率是否小于预设阈值;
若是,将所述候选文本区域删除,并依据所述第一备选文本区域的置信度,对所述第一备选文本区域进行非极大值抑制处理,得到所述终选文本区域;
若否,将所述候选文本区域确定为第二备选文本区域,并依据所述第一备选文本区域的置信度和所述第二备选文本区域的置信度,对所述第一备选文本区域和所述第二备选文本区域进行非极大值抑制处理,得到所述终选文本区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910188639.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体器件的制造方法
- 下一篇:轨迹回放方法及装置