[发明专利]快件关键信息提取方法、装置、电子设备及存储介质在审

专利信息
申请号: 202210615478.X 申请日: 2022-05-31
公开(公告)号: CN115018415A 公开(公告)日: 2022-09-06
发明(设计)人: 史陆敏;李丽 申请(专利权)人: 中邮信息科技(北京)有限公司
主分类号: G06Q10/08 分类号: G06Q10/08;G06V30/424;G06V30/10
代理公司: 北京品源专利代理有限公司 11332 代理人: 严慧
地址: 100037 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 快件 关键 信息 提取 方法 装置 电子设备 存储 介质
【说明书】:

发明公开了一种快件关键信息提取方法、装置、电子设备及存储介质。该方法包括:获取当前快件的面单图像,并识别所述面单图像获得所述面单图像中各快件关键信息的关键信息序列;其中,所述关键信息序列包括各快件关键信息的文本信息序列和坐标信息序列;基于所述文本信息序列和/或坐标信息序列对所述当前快件进行快件关键信息提取,得到所述当前快件的快件关键信息。通过本发明公开的技术方案,解决了现有技术中不同种类的快件面单无法直接识别出其关键信息,从而导致识别效率降低的问题,提高了不同面单中快件关键信息的识别效果。

技术领域

本发明涉及快件物流技术领域,尤其涉及一种快件关键信息提取方法、装置、电子设备及存储介质。

背景技术

随着互联网的快速发展,机器学习、深度学习在工业界的应用,在快件领域,对快件包裹自动化分拣的需求越来越多。当快件面单信息在快件分拣设备所读取的电子数据中时,可有效利用自动分拣设备实现快件包裹的自动分拣,很大程度上提高效率。

目前面单信息电子化一般采用OCR和NLP相结合的技术,对于单一种类的面单图片,传统的方法是采用特定区域OCR检测识别,按特定区域类别分别提取文本可直接得到图片所对应的内容。当面单种类增多时,需每种面单图片单独训练OCR检测识别模型来提取文本内容。每类单一模型相对简单,但场景复杂时,多种面单依赖于多个模型进行识别,使多种面单信息电子化这一任务变得复杂、且不易维护。在同一业务场景下,当同时存在多种面单,若不提前知晓某张面单所属种类时,无法匹配合适的模型来正确提取其关键信息,从而导致面单中快件关键信息的识别效果下降。

发明内容

本发明提供了一种快件关键信息提取方法、装置、电子设备及存储介质,以解决现有技术中不同种类的快件面单无法直接识别出其关键信息,从而导致识别效率降低的问题,提高了不同面单中快件关键信息的识别效果。

第一方面,本发明实施例提供了一种快件关键信息提取方法,该方法包括:

获取当前快件的面单图像,并识别所述面单图像获得所述面单图像中各快件关键信息的关键信息序列;其中,所述关键信息序列包括各快件关键信息的文本信息序列和坐标信息序列;

基于所述文本信息序列和/或坐标信息序列对所述当前快件进行快件关键信息提取,得到所述当前快件的快件关键信息。

可选的,所述识别所述面单图像获得所述面单图像中各快件关键信息的关键信息序列,包括:

基于预先训练的图像序列识别模型,对所述面单图像进行图像序列识别,得到所述面单图像中各面单序列的初始面单信息序列;

获取所述初始面单信息序列中的各文本信息序列,并基于所述文本信息序列以及预设的关键信息序列库,确定所述初始面单信息序列中的关键信息序列。

可选的,其中,所述快件关键信息包括快件归属单位和快件单号;

相应的,所述基于所述文本信息序列和/或坐标信息序列对所述当前快件进行快件关键信息提取,得到所述当前快件的快件关键信息,包括:

基于各所述坐标信息序列和预设序列阈值范围,确定所述关键信息序列中的候选关键信息序列;

确定各所述文本信息序列与预设快件单位名称库中各快件单位名称的名称相似度,并基于各所述名称相似度确定所述当前快件的快件归属单位;

确定各所述文本信息序列与预设单号组成特征的单号相似度,基于所述单号相似度确定各所述候选关键信息序列中的候选单号信息序列,并基于所述候选单号信息序列中的坐标信息序列和/或所述当前快件的快件归属单位,确定所述当前快件的快件单号。

可选的,所述基于各所述名称相似度确定所述当前快件的快件归属单位,包括:

获取各所述名称相似度中的最大名称相似度;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中邮信息科技(北京)有限公司,未经中邮信息科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210615478.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top