[发明专利]商品通关处理、对象的处理及其类别预测方法和装置有效
申请号: | 201710910632.5 | 申请日: | 2017-09-29 |
公开(公告)号: | CN109598517B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 林沛坤;王浩;朱洪波 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06F18/24 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 宋子良 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 通关 处理 对象 及其 类别 预测 方法 装置 | ||
1.一种商品通关处理方法,其特征在于,包括:
获取用户对商品进行描述的商品描述信息;
基于所述商品描述信息,利用预先训练得到的分类模型,确定所述商品的类别;
基于所述商品的类别,生成报关单;
其中,基于所述商品描述信息,利用预先训练得到的分类模型,确定所述商品的类别包括:
对所述商品的类别划分层级;依据划分的层级自顶向下,根据获取的所述商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别,其中,所述分类模型包括每层对应的层级分类模型;在确定完划分的所有层级的层级类别时得到所述商品的类别,其中,所述商品的类别通过税则号进行表示;
其中,所述税则号包括所述商品对应的至少一项分类目标,其中,所述分类目标用于表示所述商品对应的章、税目、子目和需求编码;对所述商品的类别划分层级包括:基于所述至少一项分类目标对所述税则号进行划分,得到所述层级,其中,所述层级与所述预先训练的层级分类模型相对应。
2.根据权利要求1所述的方法,其特征在于,在依据划分的层级自顶向下,根据获取的所述商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别之前,还包括:通过以下方式训练得到每层级对应的层级分类模型:
提取预定数量的商品样品的样品描述信息的特征内容;
对提取的所述预定数量的所述特征内容以及对应的层级类别进行训练得到每层级对应的层级分类模型。
3.根据权利要求2所述的方法,其特征在于,在所述商品样品的样品描述信息采用中文语言描述的情况下,提取所述预定数量的所述商品样品的样品描述信息的特征内容,包括:
对所述样品描述信息的中文进行分词,得到多个词组;
对得到的所述多个词组进行词组向量化,得到多个词向量;
对得到的所述多个词向量进行文本向量化,得到所述样品描述信息对应的文本向量,其中,所述文本向量表征所述样品描述信息的特征内容。
4.根据权利要求3所述的方法,其特征在于,对所述样品描述信息的中文进行分词,得到所述多个词组,包括:
对所述样品描述信息的中文进行分词后,对所述样品描述信息的中文进行预处理,其中,所述预处理包括以下至少之一:过滤停用词,过滤高频词,过滤低频词;
获得进行预处理后得到的所述多个词组。
5.根据权利要求1所述的方法,其特征在于,依据划分的层级自顶向下,根据获取的所述商品描述信息,以及层级对应的预先训练的层级分类模型,确定层级对应的层级类别包括:
在所述商品描述信息采用中文语言描述的情况下,对获取的所述商品描述信息进行分词得到多个词组,对所述多个词组进行词组向量化得到多个词向量,对所述多个词向量进行文本向量化得到表征所述商品描述信息的文本向量;
根据得到的所述文本向量,以及层级对应的预先训练得到的层级分类模型,确定层级对应的层级类别。
6.根据权利要求1所述的方法,其特征在于,获取所述用户对所述商品进行描述的所述商品描述信息包括:
接收所述用户输入的选项输入信息,其中,所述选项输入信息为所述用户对所述商品的属性进行描述的信息;
根据接收的所述选项输入信息,确定所述用户对所述商品进行描述的所述商品描述信息。
7.根据权利要求6所述的方法,其特征在于,所述商品的属性包括以下至少之一:
商品名称,商品描述,商品备注,其中,所述商品描述包括以下至少之一:厂家、规格型号、用途。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述商品描述信息包括以下至少之一:
商品的文本描述信息,商品的图像信息,商品的语音描述信息,商品的动画信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710910632.5/1.html,转载请声明来源钻瓜专利网。