[发明专利]快递面单品名识别方法、装置、设备及存储介质有效
申请号: | 202010310863.4 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111461133B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 许杰 | 申请(专利权)人: | 上海东普信息科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19;G06Q10/083 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 于亭 |
地址: | 201700 上海市青浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 快递 品名 识别 方法 装置 设备 存储 介质 | ||
1.一种快递面单品名识别方法,其特征在于,所述快递面单品名识别方法包括:
获取预先拍摄的多张第一快递面单图像,并分别对所述各第一快递面单图像中商品名称表格所在位置、所述商品名称表格中文字块所在位置进行标注,对应得到第一图像与第二图像;
将所述第一图像作为第一训练样本图像输入预置第一YOLOv2模型中进行训练,得到用于检测快递面单中商品名称表格所在位置的第一检测模型,以及将所述第二图像作为第二训练样本图像输入预置第二YOLOv2模型中进行训练,得到用于检测商品名称表格内文字块所在位置的第二检测模型;
获取待识别的第二快递面单图像,并将所述第二快递面单图像输入所述第一检测模型进行检测,得到所述第二快递面单图像中商品名称表格所在位置;
从所述第二快递面单图像中截取商品名称表格所在位置对应的表格区域图像,并将所述表格区域图像输入所述第二检测模型进行检测,得到所述第二快递面单图像中商品名称表格内文字块所在位置;
调用预置文字识别模型对所述表格区域图像内文字块所在位置进行文字识别,输出对应的文字信息,并将所述文字信息作为所述第二快递面单图像中的商品名称进行展示。
2.根据权利要求1所述的快递面单品名识别方法,其特征在于,所述YOLOv2模型依次包括:第一Darknet-19网络、第二Darknet-19网络、Batch NonIlalization层、Passthrough层以及分类层;
其中,所述第一Darknet-19网络用于生成训练样本图像的先验框;
所述第二Darknet-19网络用于提取所述训练样本图像的目标特征图,并调整所述先验框的位置范围;
所述Batch NonIlalization层用于对所述目标特征图进行归一化处理;
所述Passthrough层用于生成细粒度更小的目标特征图;
所述分类层用于预测所述训练样本图像的检测结果。
3.根据权利要求2所述的快递面单品名识别方法,其特征在于,所述第一检测模型或第二检测模型的训练过程包括:
将训练样本图像输入所述第一Darknet-19网络,通过所述第一Darknet-19网络对训练样本图像中的标注进行维度聚类,生成所述训练样本图像对应的先验框,其中,所述先验框用于圈定第一特征图的范围,所述训练样本图像为所述第一训练样本图像或所述第二训练样本图像;
将带有先验框的训练样本图像输入所述第二Darknet-19网络,通过所述第二Darknet-19网络提取所述训练样本图像的第一特征图,并调整先验框的位置范围,其中,所述第一特征图包括各第一快递面单图像中商品名称表格所在位置、所述商品名称表格中文字块所在位置;
将所述第一特征图输入所述Batch NonIlalization层,通过所述BatchNonIlalization层,对所述第一特征图进行归一化处理,得到规范化的第一特征图;
将所述规范化的第一特征图输入所述Passthrough层,通过所述Passthrough层对所述第二Darknet-19网络中不同语义化程度的卷积层在通道上做连接,并对对应的第一特征图做叠加,生成细粒度更小的第二特征图;
将所述第二特征图输入所述分类网络,通过所述分类网络对第二特征图中的各像素点进行预测,生成所述第二特征图对应的预测结果;
根据所述预测结果和所述训练样本图像中的标注,对所述YOLOv2模型的参数进行调整,直至所述YOLOv2模型收敛,得到对应的检测模型,其中,所述检测模型为所述第一检测模型或所述第二检测模型。
4.根据权利要求1所述的快递面单品名识别方法,其特征在于,所述从所述第二快递面单图像中截取商品名称表格所在位置对应的表格区域图像包括:
对所述第二快递面单图像进行二值化处理,得到所述第二快递面单图像像素的投影特征分布;
根据所述投影特征分布,分离所述第二快递面单图像中的商品名称表格与背景区域;
根据预设的切割阈值,确定所述第二快递面单图像中商品名称表格对应的切割范围;
根据所述切割范围,切割所述第二快递面单图像,得到商品名称表格所在位置对应的表格区域图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海东普信息科技有限公司,未经上海东普信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010310863.4/1.html,转载请声明来源钻瓜专利网。