[发明专利]物流单据品名识别方法、装置及设备在审
申请号: | 202211729347.0 | 申请日: | 2022-12-30 |
公开(公告)号: | CN115965012A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 卞晓瑜;肖鸣林;何程 | 申请(专利权)人: | 壹沓科技(上海)有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F18/214;G06F18/24;G06Q10/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 肖茹芸 |
地址: | 200040 上海市静*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物流 单据 品名 识别 方法 装置 设备 | ||
1.一种物流单据品名识别方法,其特征在于,包括:
获取物流单据及品名识别模型;
对所述物流单据进行识别,生成一个以上文字块,所述文字块中包含单据字符,各个文字块中的单据字符组成所述物流单据所包含的所有内容;
依次从各个所述文字块中选取预测文字块;
从各个所述文字块中选取所述预测文字块对应的领域文字块;
利用所述领域文字块以及所述预测文字块组成识别数据;
将所述识别数据输入至所述品名识别模型中,得到所述品名识别模型预测的所述预测文字块的分类结果,所述分类结果用于表明所述预测文字块中的单据字符是否为品名的组成部分;
根据每个文字块及其对应的分类结果,确定所述物流单据的品名。
2.根据权利要求1所述的物流单据品名识别方法,其特征在于,获取品名识别模型,包括:
获取多个训练单据以及初始品名识别模型,并生成每个所述训练单据对应的训练文字块,所述训练文字块中包含训练单据的单据字符;
依次确定每个所述训练文字块对应的训练领域文字块;
将每个所述训练文字块及其对应的训练领域文字块进行组合,得到组合数据;
根据所述训练文字块中的单据字符是否为品名的组成部分对组合数据进行标注,得到训练数据;
将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果;
基于所述预测结果以及所述训练数据,计算损失值;
根据所述损失值对所述初始品名识别模型的参数进行调整,直至所述损失值低于预置的阈值为止,将最终得到的初始品名识别模型作为品名识别模型。
3.根据权利要求2所述的物流单据品名识别方法,其特征在于,所述初始品名识别模型包括共享网络、编码识别网络以及分类网络;
将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果,包括:
将所述训练数据输入至所述共享网络,得到所述共享网络提取的共享参数;
将所述共享参数分别输入至所述编码识别网络以及所述分类网络,得到所述编码识别网络预测的商品编码以及所述分类网络预测的分类结果,所述商品编码以及所述分类结果组成所述初始品名识别模型的预测结果。
4.根据权利要求3所述的物流单据品名识别方法,其特征在于,所述根据所述损失值对所述初始品名识别模型的参数进行调整,包括:
根据所述损失值,对所述初始品名识别模型中的共享网络以及分类网络的参数进行调整。
5.根据权利要求1所述的物流单据品名识别方法,其特征在于,所述文字块中还包括该文字块的单据字符在所述物流单据中的位置信息;
所述从各个所述文字块中选取所述预测文字块对应的领域文字块,包括:
根据每个所述文字块的位置信息,确定所述预测文字块是否存在对应的左文字块、右文字块、上文字块和下文字块;
若所述预测文字块存在对应的左文字块,则从各个文字块中选取所述预测文字块的左文字块作为所述预测文字块的领域文字块;
若所述预测文字块存在对应的右文字块,则从各个文字块中选取所述预测文字块的右文字块作为所述预测文字块的领域文字块;
若所述预测文字块存在对应的上文字块,则从各个文字块中选取所述预测文字块的上文字块作为所述预测文字块的领域文字块;
若所述预测文字块存在对应的下文字块,则从各个文字块中选取所述预测文字块的下文字块作为所述预测文字块的领域文字块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于壹沓科技(上海)有限公司,未经壹沓科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211729347.0/1.html,转载请声明来源钻瓜专利网。