[发明专利]一种处理物流单的方法、装置及存储介质在审
申请号: | 202010241316.5 | 申请日: | 2020-03-31 |
公开(公告)号: | CN113469161A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 武晨;赵培;杨刘洋 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/62;G06N3/02;G06N3/08;G06Q10/08 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 远明 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理 物流 方法 装置 存储 介质 | ||
1.一种处理物流单的方法,其特征在于,所述方法包括:
获取待识别的目标物流单图片;
采用目标标注框标识所述目标物流单图片中的关键字段信息;
获取所述目标标注框在所述目标物流单图片中的坐标信息;
根据所述目标标注框的坐标信息,从所述目标物流单图片中截取对应关键字段信息的目标区域;
识别所述目标区域中的目标文本;
将所述目标文本作为目标关键信息输出,所述目标关键信息用于表示所述目标物流单图片对应的物流信息。
2.根据权利要求1所述的方法,其特征在于,所述识别所述目标区域中的目标文本之后,所述方法还包括:
计算识别出所述目标文本的置信度;
将置信度高于预设置信度的目标文本作为所述目标关键信息。
3.根据权利要求2所述的方法,其特征在于,所述目标区域为至少一个,所述目标文本为至少一个;所述计算识别出所述目标文本的置信度,包括:
获取各目标区域中的每个目标文字的置信度;
将各个目标文本的置信度相乘,得到所述目标文本的置信度。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述识别所述目标区域中的目标文本,包括:
对所述目标区域进行水平投影,得到投影区域;
确定所述投影区域中的文本区域和空白区域;
获取所述文本区域的像素值和所述空白区域的像素值;
根据所述文字区域的像素值和所述空白区域的像素值的差值,确定所述文本区域中目标文本的边界信息。
5.根据权利要求4所述的方法,其特征在于,所述获取所述文本区域的像素值和所述空白区域的像素值;根据所述文字区域的像素值和所述空白区域的像素值的差值,确定所述文本区域中目标文本的边界信息,包括:
计算所述文本区域中每一行像素点的像素和,以及所述空白区域中每一列像素点的像素和;
根据预设像素阈值、所述文本区域中每一行像素点的像素和,以及所述空白区域中每一列像素点的像素和,确定所述目标文本的起始行、结束行、起始列和结束列;
根据所述目标文本的起始行、结束行、起始列和结束列,确定所述目标文本的边界信息。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取训练样本,所述训练样本包括多张物流单图片;
采用标注框在各物流单图片上标注空运业务的多项关键信息在所述物流单图片中的位置信息,记录用于标记所述位置信息的标记框的坐标信息;
将标注了位置信息的所述物流单图片输入定位模型中,通过所述定位模型识别所述物流单图片上各标注框的类别,将每一类的标注框尺寸作为所述定位模型中候选框的先验尺寸;
压缩图片尺寸,并根据所述物流单图片中各标注框的坐标信息更新所述定位模型的各层权重,以得到所述定位模型的最优模型参数。
7.根据权利要求1-3中任一项所述的方法,其特征在于,所述获取待识别的目标物流单图片之后,所述采用目标标注框标识所述目标物流单图片中的关键字段信息之前,所述方法还包括:
获取所述目标物流单图片的轮廓信息;
获取所述目标物流单图片中的直线;
根据每条直线的起始坐标和终点坐标获取直线的偏转角;
统计次数最多的偏转角作为所述目标物流单图片的目标偏转角;
对所述目标偏转角进行修正,得到修正后的所述目标物流单图片。
8.根据权利要求1-3中任一项所述的方法,其特征在于,所述识别所述目标区域中的目标文本之后,所述方法还包括:
根据标注框的类型确定所述目标文本的类型;
根据所述目标文本的类型在所述目标文本上设置标签,所述标签用于标识所述目标文本属于的关键信息类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010241316.5/1.html,转载请声明来源钻瓜专利网。