[发明专利]报关信息处理方法、装置及电子设备在审
申请号: | 202110278511.X | 申请日: | 2021-03-12 |
公开(公告)号: | CN113296613A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 李清刚;蒋磊;赵方州;郑婷婷;王楚精;周明波 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F40/295;G06Q10/08;G06Q10/10;G06Q50/26 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 南海燕 |
地址: | 新加坡珊顿道*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 报关 信息处理 方法 装置 电子设备 | ||
1.一种报关信息处理方法,其特征在于,包括:
确定待生成的报关单关联的报关材料文件;
对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;
在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。
2.根据权利要求1所述的方法,其特征在于,
所述提供关于所述目标字段中待输入信息的推荐信息,包括:
确定所述目标字段的待输入信息关联的文本规则;
根据符合所述文本规则的命名实体,确定所述推荐信息。
3.根据权利要求1所述的方法,其特征在于,
所述提供关于所述目标字段中待输入信息的推荐信息,包括:
根据所述命名实体与所述目标字段中已输入的部分信息的相关性,确定所述推荐信息。
4.根据权利要求3所述的方法,其特征在于,
所述目标字段的待输入信息包括中文信息,所述已输入的部分信息包括:所述中文信息中的部分中文字符,或者所述中文信息对应的简拼字母信息。
5.根据权利要求3所述的方法,其特征在于,
所述根据所述命名实体与所述目标字段中已输入的部分信息的相关性,确定所述推荐信息,包括:
根据所述命名实体与所述目标字段中已输入的部分信息的相关性,将所述命名实体包含的全部字符或者部分字符确定为所述推荐信息。
6.根据权利要求1所述的方法,其特征在于,
在对所述报关材料文件的文本信息内容进行识别时,还包括:
确定所述命名实体之间的位置关系信息;
根据所述位置关系信息,确定多个命名实体对,所述命名实体对中的两个命名实体对应同一字段的名称与内容信息;
根据所述同一字段的名称与内容信息之间的对应关系信息,将代表字段内容的命名实体自动匹配到所述报关单中对应的字段中。
7.根据权利要求6所述的方法,其特征在于,
所述提供关于所述目标字段中待输入信息的推荐信息,包括:
根据未能匹配到所述报关单中对应的字段中的命名实体,提供关于所述目标字段中待输入信息的推荐信息。
8.根据权利要求6所述的方法,其特征在于,
如果所述报关材料文件为电子表格类文件,则所述对所述报关材料文件的文本信息内容进行识别,包括:
对所述电子表格类文件中的文本信息内容进行命名实体识别;
根据所识别出的命名实体识别在所述电子表格文件中的位置信息,确定所述命名实体之间的位置关系信息。
9.根据权利要求6所述的方法,其特征在于,
如果所述报关材料文件为不可编辑格式,则所述对所述报关材料文件的文本信息内容进行识别,包括:
对所述报关材料文件进行光学字符识别OCR,确定其中包含的字符以及对应的位置信息;
对OCR识别结果中包含的字符信息进行命名实体识别,确定所述报关材料文件中包含的命名实体;
根据所述OCR识别结果中包含的位置信息,确定所述命名实体之间的位置关系信息。
10.根据权利要求9所述的方法,其特征在于,还包括:
如果所述报关材料文件为可编辑格式,则将所述报关材料文件转换为不可编辑格式,并按照所述不可编辑格式的报关材料文件对应的方式进行识别。
11.根据权利要求1所述的方法,其特征在于,还包括:
确定所述报关材料文件关联的历史记录数据;
如果不存在与所述目标字段匹配的命名实体,则根据所述历史记录数据提供关于所述目标字段中待输入信息的推荐信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司,未经阿里巴巴新加坡控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110278511.X/1.html,转载请声明来源钻瓜专利网。