[发明专利]店铺招牌识别方法及装置、存储介质和计算机设备在审
申请号: | 202011639439.0 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112733830A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 毛小明;陈新泽;姬东飞;包敏豪;黄冠;都大龙 | 申请(专利权)人: | 上海芯翌智能科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/46;G06K9/62;G06F40/194 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张振军 |
地址: | 200434 上海市虹*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 店铺 招牌 识别 方法 装置 存储 介质 计算机 设备 | ||
1.一种店铺招牌识别方法,其特征在于,所述方法包括:
获取目标图片,所述目标图片通过对待识别招牌进行图像采集得到;
对所述目标图片进行文本区域检测,以得到所述待识别招牌中包含的一个或多个文本区域;
对各个文本区域进行文本识别,以得到各个文本区域的文本内容;
将所述待识别招牌的所有文本内容与招牌信息库中存储的招牌信息相匹配,并输出匹配结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标图片进行文本区域检测,以得到所述待识别招牌中包含的一个或多个文本区域,包括:
提取所述目标图片的具有不同分辨率的若干个第一特征图;
对所述若干个第一特征图进行特征增强,并将若干个增强的第一特征图进行特征融合,得到第二特征图;
根据所述第二特征图得到所述待识别招牌中包含的一个或多个文本区域。
3.根据权利要求2所述的方法,其特征在于,所述将若干个增强的第一特征图进行特征融合,得到第二特征图,还包括:
对若干个增强的第一特征图分别卷积,以得到各个增强的第一特征图对应的第三特征图;
经双线性差值处理将各个第三特征图放大/缩小到相同的分辨率,并对放大/缩小后的若干个第三特征图进行特征融合,得到所述第二特征图。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述第二特征图得到所述待识别招牌中包含的一个或多个文本区域,包括:
将所述第二特征图分别进行多次卷积处理,在所述第二特征图中标注所述文本区域、所述文本区域的核以及所述文本区域的相似向量;
结合所述第二特征图中标注的文本区域、核和相似向量,从所述第二特征图中分割出一个或多个所述文本区域。
5.根据权利要求1所述的方法,其特征在于,所述对各个文本区域进行文本识别,以得到各个文本区域的文本内容,包括:
针对每一文本区域,通过特征提取网络提取该文本区域的若干个不同分辨率的文本特征图;
将若干个所述文本特征图经卷积对准模块,得到各个文本特征图的注意力权重矩阵;
根据各个文本特征图及其注意力权重矩阵,得到待识别招牌中包含的文本对应的特征注意力结果;
使用解码器对所述特征注意力结果进行解码,以得到该文本区域的文本内容。
6.根据权利要求5所述的方法,其特征在于,所述根据各个文本特征图及其注意力权重矩阵,得到待识别招牌中包含的文本对应的特征注意力结果,包括:
计算各个文本特征图与其注意力权重矩阵之间的点积之和,所述和为所述特征注意力结果。
7.根据权利要求5或6所述的方法,其特征在于,所述文本内容包括若干个字符,所述解码器在解码过程中,将当前字符的前一字符的解码结果引入所述当前字符的解码过程中。
8.根据权利要求1所述的方法,其特征在于,所述招牌信息库中还存储各个招牌信息对应的位置信息,所述方法还包括:
获取所述待识别招牌的地理位置信息;
结合所述待识别招牌的地理位置信息,将所述待识别招牌的所有文本内容与招牌信息库中存储的招牌信息相匹配。
9.根据权利要求8所述的方法,其特征在于,所述将所述待识别招牌的所有文本内容与招牌信息库中存储的招牌信息相匹配,包括:
若匹配不成功,则将所述待识别招牌的所有文本内容作为新增招牌信息存入所述招牌信息库,并将所述待识别招牌的位置信息对应存入所述招牌信息库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海芯翌智能科技有限公司,未经上海芯翌智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011639439.0/1.html,转载请声明来源钻瓜专利网。