[发明专利]一种物品关键属性生成方法、物品分类方法和装置有效
申请号: | 201911174009.3 | 申请日: | 2019-11-26 |
公开(公告)号: | CN111126442B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 蒋士淼 | 申请(专利权)人: | 北京京邦达贸易有限公司;北京京东乾石科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/2458 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李阳;赵迪 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 物品 关键 属性 生成 方法 分类 装置 | ||
本发明公开了一种物品关键属性生成方法、物品分类方法和装置,涉及计算机技术领域。该物品分类方法的一具体实施方式包括:将多个待分类物品的关键属性的属性值分别进行标准化处理,拼接标准化处理结果得到多个待分类物品的属性向量;为多个待分类物品构建与属性向量的长度相同的权重向量;将属性向量输入聚类算法,计算待分类物品的属性向量与聚类中心的相似度,以按照相似度高低,对多个待分类物品的属性向量进行聚类得到聚类结果;其中,相似度是利用权重向量调整待分类物品的属性向量到聚类中心的距离得到。该方法实现了自动对归属于某一品类的物品的更细层次的分类,分类效率高,同时聚类结果中同一分簇的物品之间的关联性好,提升客户体验。
技术领域
本发明涉及计算机领域,尤其涉及一种物品关键属性生成方法、物品分类方法和装置。
背景技术
为了方便用户对电商网站内的物品进行浏览和筛选,各电商公司需要参考1987年国家颁布的国家标准GB7635-87《全国工农业产品(商品、物资)分类与代码》对物品进行分类。但是,当前最细粒度的品类中,依然包含成千上百种物品。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
(1)现有技术中物品分类的粒度较粗,最细粒度的品类中包含成千上百种物品,在实际管理运营过程中,需要人工进行大量的细分操作,效率低;
(2)人工细分的主观性较强,细分标准难以统一,导致细分得到的归属于同一分类的物品之间关联性差,客户体验差。
发明内容
有鉴于此,本发明实施例提供一种物品关键属性生成方法、物品分类方法和装置,通过关键属性的属性值在搜索日志中的出现次数确定该关键属性的权重,后续使用权重调整聚类算法的相似度度量公式,以对待分类物品的属性向量进行聚类,实现了自动对归属于某一品类的物品的更细层次的分类,分类效率高,同时聚类结果中同一分簇的物品之间的关联性好,提升客户体验。
为实现上述目的,根据本发明实施例的一个方面,提供了一种物品关键属性生成方法。
本发明实施例的一种物品关键属性生成方法,包括:获取物品不同级别的属性,根据搜索日志中包含所述属性的频次,得到所述属性的初始权重;根据所述属性的父属性的初始权重和子属性的初始权重,更新所述属性的初始权重,得到对应的最终权重;其中,所述属性的父属性、子属性基于属性之间的归属关系得到;按照所述最终权重的大小,选择最终权重大的前N个属性作为关键属性。
可选地,根据所述属性的父属性的初始权重和子属性的初始权重,更新所述属性的初始权重,得到对应的最终权重,包括:将所述属性的父属性的初始权重与归属于所述父属性的属性数量相除,得到相除结果;将所述属性的初始权重、所述相除结果以及所述属性的子属性的初始权重之和相加,得到所述属性的最终权重。
可选地,获取物品不同级别的属性的步骤之后,所述方法还包括:根据属性之间的归属关系,为归属于同一品类的多个所述物品构建属性结构树;其中,所述属性结构树包括多个节点,一个所述节点对应一个所述属性;结合所述属性结构树,确定所述属性的父属性和子属性;其中,所述父属性为所述属性对应节点的父节点的属性,所述子属性为所述属性对应节点的子节点的属性。
可选地,所述方法用于信息搜索、信息查询和信息分类。
为实现上述目的,根据本发明实施例的一个方面,提供了一种物品分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京邦达贸易有限公司;北京京东乾石科技有限公司,未经北京京邦达贸易有限公司;北京京东乾石科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911174009.3/2.html,转载请声明来源钻瓜专利网。