[发明专利]物流单据品名识别方法、装置及设备在审
申请号: | 202211729347.0 | 申请日: | 2022-12-30 |
公开(公告)号: | CN115965012A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 卞晓瑜;肖鸣林;何程 | 申请(专利权)人: | 壹沓科技(上海)有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F18/214;G06F18/24;G06Q10/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 肖茹芸 |
地址: | 200040 上海市静*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物流 单据 品名 识别 方法 装置 设备 | ||
本申请公开了一种物流单据品名识别方法、装置及设备,该方法包括获取物流单据及品名识别模型;对物流单据进行识别,生成一个以上文字块,文字块中包含单据字符,各个文字块中的单据字符组成物流单据所包含的所有内容;依次从各个文字块中选取预测文字块;从各个文字块中选取预测文字块对应的领域文字块;利用领域文字块和预测文字块组成识别数据;将识别数据输入至品名识别模型中,得到品名识别模型预测的预测文字块的分类结果,分类结果用于表明预测文字块中的单据字符是否为品名的组成部分;根据每个文字块及其对应的分类结果,确定物流单据的品名。可见,本申请在确定品名的过程中,并不受限于物流单据中是否存在表格区域。
技术领域
本申请涉及信息识别技术领域,更具体地说,涉及一种物流单据品名识别方法、装置及设备。
背景技术
随着物联网产业链的飞速发展,快递运输为人们的生活带来了许多便利。为了避免快递运输出错,一般通过物流单据实现各个快递的分类。而快递单据中不仅包含寄件人信息以及收件人信息,还包含商品的名称、商品的编码、属性等与商品本身有关的参数,且这些与商品本身有关的参数对于快递公司而言亦是十分重要的。
现有技术中通过文字识别网络对物流单据的表格区域进行文字识别,实现品名识别,但现有技术仅能对表格区域进行文字识别,一旦物流单据中不存在表格,品名识别准确度降低。
发明内容
有鉴于此,本申请提供了一种物流单据品名识别方法、装置及设备,用于解决现有技术的品名识别方法受限于存在表格的物流单据的缺点。
为了实现上述目的,现提出的方案如下:
一种物流单据品名识别方法,包括:
获取物流单据及品名识别模型;
对所述物流单据进行识别,生成一个以上文字块,所述文字块中包含单据字符,各个文字块中的单据字符组成所述物流单据所包含的所有内容;
依次从各个所述文字块中选取预测文字块;
从各个所述文字块中选取所述预测文字块对应的领域文字块;
利用所述领域文字块以及所述预测文字块组成识别数据;
将所述识别数据输入至所述品名识别模型中,得到所述品名识别模型预测的所述预测文字块的分类结果,所述分类结果用于表明所述预测文字块中的单据字符是否为品名的组成部分;
根据每个文字块及其对应的分类结果,确定所述物流单据的品名。
可选的,所述获取品名识别模型,包括:
获取多个训练单据以及初始品名识别模型,并生成每个所述训练单据对应的训练文字块,所述训练文字块中包含训练单据的单据字符;
依次确定每个所述训练文字块对应的训练领域文字块;
将每个所述训练文字块及其对应的训练领域文字块进行组合,得到组合数据;
根据所述训练文字块中的单据字符是否为品名的组成部分对组合数据进行标注,得到训练数据;
将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果;
基于所述预测结果以及所述训练数据,计算损失值;
根据所述损失值对所述初始品名识别模型的参数进行调整,直至所述损失值低于预置的阈值为止,将最终得到的初始品名识别模型作为品名识别模型。
可选的,所述初始品名识别模型包括共享网络、编码识别网络以及分类网络;
将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于壹沓科技(上海)有限公司,未经壹沓科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211729347.0/2.html,转载请声明来源钻瓜专利网。