[发明专利]用于识别文字标志的方法、装置、设备以及存储介质有效
申请号: | 202110929257.5 | 申请日: | 2021-08-13 |
公开(公告)号: | CN113657364B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 刘星;张言;邓远达;梁晓旭;胡旭 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/148 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 文字 标志 方法 装置 设备 以及 存储 介质 | ||
1.一种用于识别文字标志的方法,包括:
获取待识别文字标志,所述待识别文字标志中包括第一样式文字;
对所述待识别文字标志进行图像区域定位,得到与所述第一样式文字对应的图像区块;
对所述图像区块进行区块映射,得到目标图像区块,所述目标图像区块中包括第二样式文字;
对所述第二样式文字进行字符识别,得到待识别文字标志的识别结果;
其中,在所述对所述图像区块进行区块映射,得到目标图像区块之前,还包括:对所述图像区块进行空间变换,得到变换后的图像区块,所述空间变换包括:旋转变换、颜色变换和/或放射变换;
所述对所述第二样式文字进行字符识别,得到识别结果,包括:
采用文字分类法或预先训练得到的文字识别模型对所述第二样式文字进行字符识别,得到第一识别结果;响应于所述第一识别结果包括所述待识别文字标志中的全部文字,将所述第一识别结果作为所述待识别文字标志的识别结果;
响应于所述第一识别结果未包括所述待识别文字标志中的全部文字,将所述待识别文字标志中未被识别出的部分作为第一文字标志;对所述第一文字标志进行特征提取,得到所述第一文字标志对应的多个特征向量;将所述多个特征向量中的各个特征向量与模板库中的样本向量进行比对,生成第二识别结果;对所述第一识别结果和所述第二识别结果进行整合,得到所述待识别文字标志的识别结果。
2.根据权利要求1所述的方法,其中,所述对所述图像区块进行区块映射,得到目标图像区块,包括:
利用以下步骤进行迭代处理,直到满足迭代停止条件:
对所述图像区块进行一次区块映射,得到当前的第一图像区块;
判断当前的第一图像区块是否为标准图像区块,若否,增加所述区块映射的映射次数;
若是,则停止迭代,并将当前的第一图像区块作为目标图像区块。
3.根据权利要求2所述的方法,其中,所述第二样式文字包括标准字体文字;
所述对所述图像区块进行区块映射,得到目标图像区块,还包括:
从标准字体数据库中获取标准图像区块。
4.根据权利要求1所述的方法,其中,所述对所述第一文字标志进行特征提取,得到所述第一文字标志对应的各个特征向量,包括:
利用训练得到的特征提取模型对所述第一文字标志进行特征提取,得到所述第一文字标志对应的各个特征向量,其中,所述特征提取模型基于卷积神经网络和Transformer网络而构建。
5.根据权利要求1所述的方法,其中,所述获取待识别文字标志包括:
获取初始文字标志;
对所述初始文字标志进行字符识别,得到初始识别结果;
将所述初始文字标志中未被识别出的部分作为待识别文字标志。
6.根据权利要求5所述的方法,还包括:
对所述初始识别结果和所述待识别文字标志的识别结果进行整合,得到所述初始文字标志的最终识别结果。
7.根据权利要求1-6任一项所述的方法,还包括:
对初始文字标志的最终识别结果进行授权核验;
输出所述授权核验结果对应的提示信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110929257.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能反向攻击标靶
- 下一篇:一种用于色谱仪的取样衔接装置