[发明专利]字符检测方法及装置、电子设备和存储介质有效
申请号: | 202011229418.1 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112348025B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 毕研广;胡志强 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06N3/0464;G06N3/08;G06V30/19 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 检测 方法 装置 电子设备 存储 介质 | ||
本公开涉及一种字符检测方法及装置、电子设备和存储介质。所述方法包括:对待处理图像中第一字符序列的多条边界线分别进行预测,得到所述第一字符序列的多条边界线的预测参数,其中,所述第一字符序列的边界线表示所述第一字符序列所在区域与非所述第一字符序列所在区域之间的分界线;根据所述第一字符序列的多条边界线的预测参数,确定所述第一字符序列的边界框的顶点的位置信息;根据所述第一字符序列的边界框的顶点的位置信息,确定所述第一字符序列的边界框的位置信息。
技术领域
本公开涉及计算机视觉技术领域,尤其涉及一种字符检测方法及装置、电子设备和存储介质。
背景技术
自然场景下的字符检测是计算机视觉中的重要研究领域,且已被应用于多种应用场景,例如实时文本翻译、单据识别、车牌识别等。一般而言,字符在实际应用场景中处于刚性平面,然而在成像过程中,由于相机的视角扭曲和畸变,导致图像中的字符呈现为不规则的任意四边形形状。对于这些字符,需要对其四条边界精确地回归定位,才能在后续的字符识别环节中矫正出正确的字符形状,从而正确识别出字符内容。
发明内容
本公开提供了一种字符检测技术方案。
根据本公开的一方面,提供了一种字符检测方法,包括:
对待处理图像中第一字符序列的多条边界线分别进行预测,得到所述第一字符序列的多条边界线的预测参数,其中,所述第一字符序列的边界线表示所述第一字符序列所在区域与非所述第一字符序列所在区域之间的分界线;
根据所述第一字符序列的多条边界线的预测参数,确定所述第一字符序列的边界框的顶点的位置信息;
根据所述第一字符序列的边界框的顶点的位置信息,确定所述第一字符序列的边界框的位置信息。
在本公开实施例中,通过对待处理图像中第一字符序列的多条边界线分别进行预测,得到所述第一字符序列的多条边界线的预测参数,根据所述第一字符序列的多条边界线的预测参数,确定所述第一字符序列的边界框的顶点的位置信息,并根据所述第一字符序列的边界框的顶点的位置信息,确定所述第一字符序列的边界框的位置信息,由此将字符序列的多边形(例如四边形)边界框拆解为多条(例如四条)独立的边界线,对每一条独立的边界线进行单独检测,从而每一条边界线的检测均不会被两个不同的顶点所干扰,进而能够提高字符检测的准确性。
在一种可能的实现方式中,所述对待处理图像中第一字符序列的多条边界线分别进行预测,得到所述第一字符序列的多条边界线的预测参数,包括:
基于所述待处理图像,针对与第一字符序列相关的第一特征点,分别预测所述第一字符序列的多条边界线对应于所述第一特征点的参数;
根据所述第一字符序列的多条边界线对应于所述第一特征点的参数,确定所述第一字符序列的多条边界线的预测参数。
在该实现方式中,基于所述待处理图像,针对与第一字符序列相关的第一特征点,分别预测所述第一字符序列的多条边界线对应于所述第一特征点的参数,并根据所述第一字符序列的多条边界线对应于所述第一特征点的参数,确定所述第一字符序列的多条边界线的预测参数,由此基于与第一字符序列相关的特征点对第一字符序列的边界线的参数进行预测,从而有助于提高得到边界线的预测参数的效率,并有助于提高所得到的预测参数的准确性。
在一种可能的实现方式中,所述方法还包括:
预测所述待处理图像中的像素所在位置属于字符的概率;
根据所述待处理图像中的像素所在位置属于字符的概率,确定所述第一特征点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011229418.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防破坏型好的家庭防盗报警装置
- 下一篇:一种安防用祭祀品焚烧箱