[发明专利]基于机器学习获得商品对应国民经济制造业的方法及系统在审
申请号: | 202010414176.7 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111782802A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 刘春雷;包江华;范超;杜长青;刘治军 | 申请(专利权)人: | 北京极兆技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08;G06Q30/06 |
代理公司: | 北京海虹嘉诚知识产权代理有限公司 11129 | 代理人: | 高丽萍 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 获得 商品 对应 国民经济 制造业 方法 系统 | ||
本发明涉及一种基于机器学习获得商品对应国民经济制造业的方法及系统,通过机器学习算法将千差万别的具体商品归一化到国家标准商品体系中的制造行业体系建立的商品知识图谱数据库中的最底层的分类中,并利用向量比较算法得到最底层的商品分类与国民经济制造业行业的底层分类之间的映射关系,并利用最底层的商品分类与映射关系迭代训练能够反映商品到国民经济制造业行业的映射关系的商品分类预测模型,由此得到的商品分类预测模型商品覆盖面广,完全覆盖国家标准设计的几千个最小的种类,并且利用了最先进的深度学习模型,预测效果极好;该商品分类预测模型将商品和国民经济制造业行业成功关联起来,为其他相关的应用打下了很好的基础。
技术领域
本发明属于互联网电子商务领域,具体涉及一种基于机器学习获得商品对应国民经济制造业的方法及系统。
背景技术
互联网发展迅猛,越来越多的商品通过电子商务进行销售。快速,准确地对所出售的商品进行类别的划分显得更加重要。商品分类是为了方便消费者购买的需要,将商品选择适当的分类标志,系统地逐级分类。但是现有的分类方法多是基于统计或者简单的机器学习技术,因此得到的分类效果不佳,或者能够预测的分类个数有限,分类效果不好,并且分类后应用单一。
发明内容
针对上述现有技术存在的目前的现有的分类方法多是基于统计或者简单的机器学习技术,因此得到的分类效果不佳,或者能够预测的分类个数有限,分类效果不好,并且分类后应用单一的技术问题,本发明提供一种基于机器学习获得商品对应国民经济制造业的方法,该方法利用机器学习算法将商品与国民经济制造业行业关联起来,商品覆盖范围广,利用深度学习模型,预测效果好,为相关应用打下了良好的基础。本发明还涉及一种基于机器学习获得商品对应国民经济制造业的系统。
本发明的技术方案如下:
一种基于机器学习获得商品对应国民经济制造业的方法,其特征在于,所述方法包括如下步骤:
S1,采集有标签的商品分类数据作为初始训练样本集利用机器学习算法训练初始深度学习模型,所述初始深度学习模型为长短时记忆循环神经网络;
S2,利用所述初始深度学习模型对无标签数据进行分类,根据分类结果对所述初始深度学习模型进行迭代训练得到用于将商品进行底层类别分类的第一商品分类预测模型;
S3,根据国家标准商品体系中的制造行业体系建立商品知识图谱数据库,在所述商品知识图谱数据库中提取目标商品的文本格式商品数据;利用所述第一商品分类预测模型根据机器学习算法对所述目标商品的文本格式商品数据进行归一化分类得到文本格式底层商品分类数据;再将所述文本格式底层商品分类数据转变为数值化的向量,利用向量比较算法判断文本的相似性从而得出商品分类与国民经济制造业行业的映射关系;
S4,将所述文本格式底层商品分类数据与所述映射关系作为训练样本,对所述第一商品分类预测模型进行迭代训练,得到用于反映商品到国民经济制造业行业的映射关系的第二商品分类预测模型;
S5,所述第二商品分类预测模型根据输入的任一商品的文本格式的商品数据得到所述任一商品所对应的国民经济制造业行业。
进一步地,在步骤S3中,所述第一、第二商品分类预测模型均为长短时记忆循环神经网络。
进一步地,所述长短时记忆循环神经网络为双向长短时记忆循环神经网络。
进一步地,在步骤S3中,所述将所述文本格式底层商品分类数据转变为数值化的向量,利用向量比较算法判断文本的相似性从而得出商品分类与国民经济制造业行业的映射关系包括步骤:
S31,将所述文本格式底层商品分类数据中每一个类别中的每一个汉字或字符进行数值化编码,得到每一个汉字或字符的300维度的向量表示,按照原始底层商品分类数据中的每一个类别中每一个汉字或字符的先后顺序将数值化编码后的每一个汉字或字符对应的向量依次进行矢量相加,分别得到各类别所对应的第一向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京极兆技术有限公司,未经北京极兆技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010414176.7/2.html,转载请声明来源钻瓜专利网。