[发明专利]一种基于枸杞质量决策树的数据挖掘方法在审
申请号: | 201810434080.X | 申请日: | 2018-05-08 |
公开(公告)号: | CN108829724A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 怀化 | 申请(专利权)人: | 亳州中药材商品交易中心有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q10/06 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 安娜 |
地址: | 236800 安徽省亳*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 枸杞 决策树 数据挖掘 数据归一化 真实数据 归一化 集合 数据采集系统 定量和定性 质量数据库 结果判断 目标数据 数据缓冲 数据使用 提取数据 统计分析 影响因素 质量分析 质量数据 构建 删除 干预 分类 预测 种植 决策 制定 | ||
1.一种基于枸杞质量决策树的数据挖掘方法,其特征在于:基于决策树的数据挖掘方法包括:
步骤一,对汇总的枸杞质量数据统计分析,获得真实数据;
步骤二,基于真实数据构建决策树;
步骤三,数据归一化:将目标数据集合内的数据进行归一化,将归一化过程中删除的数据进行原始位置标记,并存入数据缓冲集合;
步骤四,结果判断:根据数据归一化的结果,从决策树中选取相应决策。
2.根据权利要求1所述的一种基于枸杞质量决策树的数据挖掘方法,其特征在于:基于真实数据构建决策树的过程包括:根据真实数据的元素特征确定其归属的数据类型,根据数据类型为决策树上的节点分配对应的变量;建立该变量与地址之间的对应关系,在地址中存放数据类型对应的真实数据。
3.根据权利要求2所述的一种基于枸杞质量决策树的数据挖掘方法,其特征在于:所述根据所述数据类型为决策树上的节点分配对应的变量的过程包括:数据类型分组之间的差异最大的原则将真实数据进行切分,每次切分的真实数据分配一个变量,并对应分配一个节点。
4.根据权利要求1所述的一种基于枸杞质量决策树的数据挖掘方法,其特征在于:步骤一,包括对数据统计分析;采用多元回归统计分析方法,其处理过程为:分为三个阶段:搜集数据、分析数据和进行推理。
5.根据权利要求1所述的一种基于枸杞质量决策树的数据挖掘方法,其特征在于:步骤二,通过递归分割的过程来构建决策树。
6.根据权利要求1所述的一种基于枸杞质量决策树的数据挖掘方法,其特征在于:决策树构建:(1)寻找初始分裂,将训练集作为产生决策树的集合,将训练集好的记录分类;以属性域作为分类指标;
(2)决策树增长到一棵完整的树,重复(1),直至每个叶节点内的记录都属于同一类;
(3)数据的修剪,去掉噪音或者异常的数据;
(4)关联规则。
7.根据权利要求6所述的一种基于枸杞质量决策树的数据挖掘方法,其特征在于:记录用所选属性递归的进行分割;属性的选择是基于一个启发式规则或者一个统计的度量;停止分割的条件:一个节点上的数据都是属于同一个类别。
8.根据权利要求6所述的一种基于枸杞质量决策树的数据挖掘方法,其特征在于:规则反映数据项中某些属性或数据集中某些数据项之间的统计相关性,其形式为:X1∧…∧XnY[C,S],表示由X1∧…∧Xn可以预测Y,其中可信度为C,支持度为S。
9.根据权利要求8所述的一种基于枸杞质量决策树的数据挖掘方法,其特征在于:给定一个交易集D,挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则;基于规则中处理的变量的类别为数值型;数值型关联规则和多维关联或多层关联规则结合起来,对数值型字段进行处理,将其进行动态的分割,或者直接对原始的数据进行处理,当然数值型关联规则中包含种类变量;在多层的关联规则中,对数据的多层性已经进行了充分的考虑。
10.根据权利要求1所述的一种基于枸杞质量决策树的数据挖掘方法,其特征在于:将目标数据集合内的数据进行归一化,将归一化过程中删除的数据进行原始位置标记,并存入数据缓冲集合;归一化的目标函数的形式为y=ax2+bx+ex+c。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亳州中药材商品交易中心有限公司,未经亳州中药材商品交易中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810434080.X/1.html,转载请声明来源钻瓜专利网。