[发明专利]一种商品分类方法、装置、电子设备及存储介质在审
申请号: | 202010209868.8 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111340566A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 黄志翔;张一凡;彭南博;程建波 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/901;G06F16/906 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 刘晓燕;刘蔓莉 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 商品 分类 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供的一种商品分类方法、装置、电子设备及存储介质,获取商品交易数据,根据商品交易数据生成表示商品之间关联关系的商品关联图,根据商品关联图得到各商品的词向量,可以量化商品之间的关系,采用预设的聚类算法,对商品的词向量进行聚类,得到各个商品对应的类别。采用本方案可以利用客户在电商平台产生的交易数据,自动完成对商品的分类,无需人为参与,与现有的专家分类相比,节约了人力。
技术领域
本申请涉及数据处理领域,尤其涉及一种商品分类方法、装置、电子设备及存储介质。
背景技术
近年来,随着电子商务和移动互联网的高速发展,越来越多的交易在线上完成,网上商城的商品种类也越来越多,为了方便消费者购买,网上商城都会对商品进行分类,现在主要是通过用途、类型等维度进行专家分类,比如手机和配件可以分成一类,然后可以细分成手机壳和手机。
商品分类涉及到对各类产品的认知,而且经常变动,所以非常复杂,基于专家经验进行的商品分类因为无法考虑太多因素,所以会有一些不足:
因为分类是专家定的,所以如果新的商品上线了,那么就需要人工进行分类,因为现在商品的迭代是比较快的,这就导致需要经常进行分类的补充,并且要通知到相关的团队。而且如果出现人员变动,则整个分类逻辑都可能变动。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种商品分类方法、装置、电子设备及存储介质。
第一方面,本申请提供了一种商品分类方法,包括:
获取预设时间段内的商品交易数据;
根据所述交易数据生成以商品为节点,以商品之间的关联关系为边的商品关联图;
根据所述商品关联图生成各商品的词向量;
采用预设的聚类算法,对商品的词向量进行聚类,得到各个商品对应的类别。
在一种可能的实现方式中,所述交易数据包括商品信息、商品购买时间和客户信息;
根据所述交易数据生成以商品为节点,以商品之间的关联关系为边的商品关联图,包括:
根据所述交易数据生成多个商品购买序列,一个商品购买序列包含一个客户在一个预设的购买周期内购买的所有商品的信息;
分别对各个商品购买序列中的商品购买时间进行聚类,得到聚类结果;
根据所述聚类结果生成以商品为节点,以商品之间的关联关系为边的商品关联图。
在一种可能的实现方式中,根据所述聚类结果生成以商品为节点,以商品之间的关联关系为边的商品关联图,包括:
根据所述聚类结果将商品购买时间属于同一个类的商品按照购买时间的先后顺序采用有向连接线进行有向连接,所述有向连接线表示商品之间的关联关系;
生成以商品为节点、以商品之间的有向连接线为边、以任意两件商品之间的同一种有向连接线出现的次数为与所述有向连接线对应的边的权重的有向带权图;
将所述有向带权图作为商品关联图。
在一种可能的实现方式中,对商品购买序列中的商品购买时间进行聚类,得到聚类结果,包括:
确定购买时段个数的多个候选值;
分别根据各个候选值,对商品购买序列中的商品购买时间采用重心法进行聚类;
根据聚类结果按照预设的第一公式计算各个候选值对应的sim值;
确定对应的sim值最大的候选值作为购买时段个数的预设值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010209868.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:LED泄放电路和LED驱动电路
- 下一篇:数据处理系统及其数据处理方法