[发明专利]一种数据分析方法及装置在审
申请号: | 201710984887.6 | 申请日: | 2017-10-20 |
公开(公告)号: | CN109697619A | 公开(公告)日: | 2019-04-30 |
发明(设计)人: | 李园园 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 215163 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 决策系统 决策规则 销售数据 属性重要度 预定时间段 数据分析 属性集 预处理 统计分析模型 预设数据格式 个性化特点 规则生成 统计分析 数据源 支持度 置信度 权重 预设 去除 集合 挖掘 | ||
本发明公开了一种数据分析方法及装置,用以解决现有技术中存在的对数据源本身具有的个性化特点挖掘不够准确的技术问题。包括:获取产品在一预定时间段内的销售数据及产品的属性集;其中,属性集为在预定时间段内影响销售数据的因素的集合;基于预设波动阈值以及预设数据格式对销售数据进行预处理,以获得决策系统集;计算决策系统集中,每条决策规则中各属性重要度,并将属性重要度为零的属性从决策系统中去除,以获得精确的决策系统集;通过统计分析模型对精确的决策系统集中的各决策规则进行统计分析,获得核规则;并根据核规则生成指导信息;其中,核规则为置信度和支持度与权重之积最大的所述决策规则。
技术领域
本发明涉及数据挖掘技术领域,尤其是涉及一种数据分析方法及装置。
背景技术
随着计算机技术的迅猛发展,行业信息化逐步迈向下一个智能化阶段,电子商务不仅仅是一个贩卖商品的平台,也是一个收集用户销售数据的系统,将这些原始的销售数据以智能化统计分析计算后,能预测用户的购买行为模式,为商家在定制产品方面将提供决策建议。
然而,在现有技术中由于多是采用分类、聚类、关联、回归等常规数据挖掘算法对采集的原始数据进行挖掘,所以它只是对数据挖掘算法的直接引用,这样挖掘到的只是单薄的原始数据增长比率及趋势,使挖掘结果差强人意,难以决策者提供准确的决策建议。
故,如何对数据源本身具有的个性化特点进行精准挖掘,进而准确预测用户在下一周期的行为模式,并为决策者提供准确的决策建议成为一个亟待解决的技术问题。
发明内容
本发明提供一种数据分析方法及装置,用以解决现有技术中存在的对数据源本身具有的个性化特点挖掘不够准确的技术问题。
第一方面,为解决上述技术问题,本发明实施例提供的一种数据分析方法的技术方案如下:
获取产品在一预定时间段内的销售数据及所述产品的属性集;其中,所述属性集为在所述预定时间段内影响所述销售数据的因素的集合;
基于预设波动阈值以及预设数据格式对所述销售数据进行预处理,以获得决策系统集;其中,所述决策系统集能使前后两个销售数据通过属性建立关联性,进而形成相应的决策规则;
计算所述决策系统集中,每条决策规则中各属性重要度,并将属性重要度为零的属性从所述决策系统中去除,以获得精确的决策系统集;
通过统计分析模型对所述精确的决策系统集中的各决策规则进行统计分析,获得核规则;并根据所述核规则生成指导信息;其中,所述核规则为置信度和支持度与权重之积最大的所述决策规则。
可选的,所述基于预设波动阈值以及预设数据格式对所述销售数据进行预处理,包括:
从所述销售数据中去除冗余数据,以获得样本数据集;其中,所述冗余数据为在所述预设波动阈值之外的销售数据;
将所述样本数据集中的数据按所述预设数据格式进行转换,生成所述决策系统集。
可选的,所述将所述样本数据集中的数据按所述预设格式进行转换,生成所述决策系统集,包括:
将所述样本数据集中前后相邻的两个销售数据作为一个数据对,并将所述属性集中的属性逐一插入所述数据对之间,以得到对应的决策对;
将从所述样本数据集中得到的各决策对各按所述预设数据格式进行转换,生成所述决策系统集。
可选的,所述计算所述决策系统集中,每条决策规则中各属性的重要度,并将属性重要度为零的属性从所述决策系统中去除,以获得精确的决策系统集,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团公司,未经中移(苏州)软件技术有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710984887.6/2.html,转载请声明来源钻瓜专利网。