[发明专利]商品价签文字精确检测定位系统及定位方法有效
申请号: | 201911375053.0 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111027554B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 徐辉;秦永强;高达辉 | 申请(专利权)人: | 创新奇智(重庆)科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/146;G06V30/18;G06V30/19;G06V10/80 |
代理公司: | 深圳珠峰知识产权代理有限公司 44899 | 代理人: | 黄伟 |
地址: | 400039 重庆市九龙坡区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 价签 文字 精确 检测 定位 系统 方法 | ||
1.一种商品价签文字精确检测定位系统,用于对商品价签上的文字进行检测、识别,其特征在于,包括:
特征提取器,所述特征提取器中包括多层连接的卷积神经网络模块,每一特征提取层中的所述卷积神经网络模块用于提取待检测的商品价签图像对应的图像特征,得到每一所述特征提取层输出的所述商品价签图像对应的第一特征图;
多个感受野调整模块,每个所述感受野调整模块对应连接所述特征提取器中的每一层上的所述卷积神经网络模块,所述感受野调整模块用于调整用于提取所述图像特征的感受野,然后以所述第一特征图为输入,提取各所述第一特征图对应的第二特征图;每个所述感受野调整模块中包括多个矩形卷积层,每个所述矩形卷积层中的卷积核数量以及卷积核尺寸相同或不同,每个所述矩形卷积层中的卷积核尺寸具有相同或不同的宽高比;
多个特征融合模块,每个所述特征融合模块对应连接一所述感受野调整模块,用于融合所述感受野调整模块输出的各所述第二特征图,得到所述第一特征图对应的特征融合图;
多个任意四边形预测模块,每个所述任意四边形预测模块对应连接一所述特征融合模块,用于对所述特征融合图上的文字区域进行任意四边形预测,并输出对所述特征融合图的任意四边形预测结果;
至少一个旋转矩形框预测模块,每个所述旋转矩形框预测模块对应连接一所述特征融合模块,用于对所述特征融合图上的所述文字区域进行旋转矩形框预测,并输出对各所述特征融合图的旋转矩形框预测结果;
至少一个文字边缘预测模块,每个所述文字边缘预测模块对应连接一个所述特征融合模块,用于预测所述特征融合图上的各所述文字区域的文字边框,得到对各所述文字区域的文字边缘预测结果;
预测结果综合模块,分别连接各所述任意四边形预测模块、各所述旋转矩形框预测模块和各所述文字边缘预测模块,用于综合各所述任意四边形预测结果、各所述旋转矩形框预测结果和各所述文字边缘预测结果,最终形成对所述商品价签图像的文字区域预测结果并存储。
2.如权利要求1所述的商品价签文字精确检测定位系统,其特征在于,所述感受野调整模块提取所述第一特征图对应的所述第二特征图采用的卷积核为矩形卷积核。
3.如权利要求1所述的商品价签文字精确检测定位系统,其特征在于,还包括:
模型训练模块,分别连接各所述任意四边形预测模块、各所述旋转矩形框预测模块和各所述文字边缘预测模块,用于以所述任意四边形预测结果、和/或所述旋转矩形框预测结果、和/或所述文字边缘预测结果以及原始输入的所述商品价签图像为训练样本,训练形成一商品价签文字检测模型,所述商品价签文字检测模型用于对待检测的所述商品价签图像进行文字区域检测,并输出对所述商品价签图像的所述文字区域预测结果。
4.如权利要求1所述的商品价签文字精确检测定位系统,其特征在于,所述旋转矩形框预测模块的设置数量为一个,仅用于对经所述特征提取器多层图像特征提取后最终输出的关联于所述商品价签图像的所述第一特征图对应的所述特征融合图上的所述文字区域进行旋转矩形框预测,输出一所述旋转矩形框预测结果。
5.如权利要求1所述的商品价签文字精确检测定位系统,其特征在于,所述文字边缘预测模块的设置数量为一个,仅用于对经所述特征提取器多层图像特征提取后最终输出的关联于所述商品价签图像的所述第一特征图对应的所述特征融合图上的所述文字区域进行文字边框预测,得到一所述文字边缘预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(重庆)科技有限公司,未经创新奇智(重庆)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911375053.0/1.html,转载请声明来源钻瓜专利网。