[发明专利]一种价格分析方法及装置在审
申请号: | 201710685511.5 | 申请日: | 2017-08-11 |
公开(公告)号: | CN109389453A | 公开(公告)日: | 2019-02-26 |
发明(设计)人: | 孙鹏飞;殷太兵 | 申请(专利权)人: | 苏宁云商集团股份有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 苏一帜 |
地址: | 210042 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 价格区间 价格分析 关键词信息 商品数据 聚类 热度 电子商务领域 关联 样本数据 类目 预设 集合 输出 分析 | ||
本发明实施例公开了一种价格分析方法及装置,涉及电子商务领域,能够扩大价格分析方案的使用范围。本发明包括:获取关键词信息和与所述关键词信息相关联的类目,并提取所述相关联的类目下的商品数据;对所获取的商品数据进行聚类,并根据聚类的结果划分商品的价格区间,所述价格区间根据区间划分模型进行划分,所述区间划分模型通过预设的样本数据集合得到;对所获取的价格区间进行热度计算,并输出热度计算结果。本发明适用于分析价格区间。
技术领域
本发明涉及电子商务领域,尤其涉及一种价格分析方法及装置。
背景技术
电子商务网站为了降低用户选择商品的难度,在结果页的高筛选项中引入价格筛选,按照关键词或类目对全部商品的价格进行分类,将其划分为价格区间。
但目前常用的价格区间的分析方式,依然存在一些缺陷,例如:完全按统计意义等间距进行划分,特别是在某些关键词或类目下的商品价格区间跨度比较大时,往往无法真实反应用户的偏好,以及还会造成某些价格区间无商品,从而导致价格区间的划分不准确的问题;并且受异常数据影响较大,如某些关键词和类目下商品价格存在异常数值,就会造成划分出来的价格区间不准确的问题。
由于目前方案中价格分析不准确的问题,导致了现有的价格分析方案所得的结果往往只能作为参考,难以基于价格分析的结果扩展出更多的业务方案,因此限制了价格分析方案的使用范围。
发明内容
本发明的实施例提供一种价格分析方法及装置,能够扩大价格分析方案的使用范围。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明的实施例提供的方法,包括:
获取关键词信息和与所述关键词信息相关联的类目,并提取所述相关联的类目下的商品数据;
对所获取的商品数据进行聚类,并根据聚类的结果划分商品的价格区间,所述价格区间根据区间划分模型进行划分,所述区间划分模型通过预设的样本数据集合得到;
对所获取的价格区间进行热度计算,并输出热度计算结果。
结合第一方面,在第一方面的第一种可能的实现方式中,还包括:
对所述样本数据集合进行数据特征提取,并识别出异常数据;
利用所述异常数据对所述样本数据集合进行平滑处理,并根据经过所述平滑处理的所述样本数据集合生成区间划分模型。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述对所述样本数据集合进行数据特征提取,并识别出异常数据,包括:
从所述样本数据集合中提取n个数据对象,并从所提取的数据对象中选择2个作为初始聚类中心,其中,n≥3;
根据与所述初始聚类中心之间的相似度,将所述初始聚类中心之外的数据对象,分配至各自最相似的类簇中,得到聚类的新簇;
计算所得到的聚类的类簇,得到各新簇中的数据对象的均值;
根据所述各新簇中的数据对象的均值和预设的阈值进行异常值识别,确定异常数据。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述从所提取的数据对象中选择2个作为初始聚类中心,包括:从25分位点和75分位点各自选取一个数据对象,作为初始聚类中心。
结合第一方面的第二种可能的实现方式,在第四种可能的实现方式中,还包括:
对从所述样本数据集合中的数据对象,进行标准化数值处理,得到各数据对象的Z分数;
将Z分数低于下限值或高于上限值的数据对象,确定为异常数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云商集团股份有限公司,未经苏宁云商集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710685511.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音销售的方法及装置
- 下一篇:贩卖界面整合系统