[发明专利]一种基于数据分析的商品分类方法有效
申请号: | 201810223284.9 | 申请日: | 2018-03-19 |
公开(公告)号: | CN108491873B | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 曾丽莉;董妮妮 | 申请(专利权)人: | 广州蓝深科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/22;G06F16/2455 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 郭智 |
地址: | 510000 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于数据分析的商品分类方法,包括以下步骤:建立商品种类的特征数据库;划分特征数据库内基本特征和特殊特征;提取需分类商品的基本特征向量和特殊特征向量;对比待分类商品和特征数据库中基本特征向量集合中的第一基本特征向量;对比其余基本特征向量得到对比基本特征向量集合;相似度系数计算,以提取相似度系数大于预设相似度系数的特殊特征向量集合;对待分类商品中的特殊特征向量与相似度系数大于预设相似度系数的特殊特征向量进行对比,得到对比特殊特征向量集合,以筛选同类系数大小最高的商品种类。本发明有效地区分商品的特征,提高了商品分类的准确性,适用于大规模的分类,大大缩短人工分类的时间。 | ||
搜索关键词: | 相似度 特征数据库 商品分类 特征向量 向量 特征向量集合 分类 数据分析 向量集合 预设 人工分类 系数计算 有效地 筛选 | ||
【主权项】:
1.一种基于数据分析的商品分类方法,其特征在于:包括以下步骤:S1、选取每个不同种类至少一个商品,对商品的特征进行提取,并将提取的特征构建特征数据库,不同种类商品按照预定的商品种类序号进行排序,特征数据库内商品的特征向量集合Ai(ai1,ai2,...,aik,...,ain),其中,Ai表示为第i个商品种类对应的特征向量集合;S2、对特征数据库内商品的特征集合Ai按照基本特征和特殊特征进行分类,分别构成基本特征向量集合Bi(bi1,bi2,...,bik),特殊特征向量集合B′i(b′i1,b′i2,...,b′iy),其中,bik表示为第i类商品的第k个基本特征向量,b′iy表示为第i类商品的第y个特殊特征向量,且n=k+y;S3、对需分类的商品提取若干特征向量,对提取的特征向量进行分组,分别划分为基本特征向量和特殊特征向量,基本特征向量集合为C(c1,c2,...ck),特殊特征向量集合为C′(c′1,c′2,...,c′v);S4、将待分类商品的基本特征向量集合中的基本特征向量c1与特征数据库中存储的基本特征向量集合的基本特征向量bi1进行一一对比,从特征数据库中提取与待分类商品的基本特征向量c1相同的商品的基本特征向量集合和特殊特征向量集合;S5、将待分类商品中的其余基本特征向量与提取的基本特征向量集合中的其余基本特征向量进行逐一比对,得到对比基本特征向量集合Dx(dx1,dx2,...,dxj,...,dxk),Dx表示为第x个商品种类对应的对比基本特征向量集合;S6、将待分类的商品与提取的基本特征向量集合对应的商品种类进行相似度系数计算,提取相似度系数大于预设相似度系数的该商品的特殊特征向量集合,并按照相似度系数从高到低的顺序依次输出该相似度系数对应的特殊特征向量集合;S7、对待分类商品中的特殊特征向量与相似度系数大于预设相似度系数的特殊特征向量进行逐一对比,得到对比特殊特征向量集合Fx(fx1,fx2,...,fxv),Fx为第x个商品种类对应的对比特殊特征向量集合;S8、统计待分类商品的特征向量与相似度系数大于预设相似度系数的商品种类的特征向量的同类系数大小,提取同类系数大小最高的商品种类,并将该待分类商品归属于同类系数最高的商品对应的种类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州蓝深科技有限公司,未经广州蓝深科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810223284.9/,转载请声明来源钻瓜专利网。