[发明专利]一种基于枸杞质量决策树的数据挖掘方法在审
申请号: | 201810434080.X | 申请日: | 2018-05-08 |
公开(公告)号: | CN108829724A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 怀化 | 申请(专利权)人: | 亳州中药材商品交易中心有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q10/06 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 安娜 |
地址: | 236800 安徽省亳*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 枸杞 决策树 数据挖掘 数据归一化 真实数据 归一化 集合 数据采集系统 定量和定性 质量数据库 结果判断 目标数据 数据缓冲 数据使用 提取数据 统计分析 影响因素 质量分析 质量数据 构建 删除 干预 分类 预测 种植 决策 制定 | ||
一种基于枸杞质量决策树的数据挖掘方法,基于决策树的数据挖掘方法包括:步骤一,对汇总的枸杞质量数据统计分析,获得真实数据;步骤二,基于真实数据构建决策树;步骤三,数据归一化:将目标数据集合内的数据进行归一化,将归一化过程中删除的数据进行原始位置标记,并存入数据缓冲集合;步骤四,结果判断:根据数据归一化的结果,从决策树中选取相应决策。优点在于:自动从枸杞质量数据库以及其它数据采集系统中提取数据;消除人为对数据的干预,使得数据使用能够如实掌握与种植及质量相关的信息;从定量和定性两个方面掌握有关指标的分布以及影响因素;提供对枸杞质量进行分类预测,辅助枸杞质量分析报告的制定。
技术领域
本发明涉及一种挖掘效率高,解决异质数据集的数据挖掘问题的基于枸杞质量决策树的数据挖掘方法。
背景技术
现有的枸杞的数据量正以成倍的速度增长,数据库的容量已经达到了上万亿字节的水平,这些数据在很大程度上都是闲置在数据库中的冗余数据,在这些大量数据的背后隐藏了很多具有决策意义的信息,要想对这些看似“无用的”数据进行查询、检索、提取然后转换成有用的辅助决策信息就显得尤为重要。
数据挖掘(Data Mining,DM)是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。现有数据挖掘的方法计算量普遍较大,面对大数据量的数据源时经常出现反应慢,效率低的问题。
随着知识爆炸,如何组合和挖掘异质数据库成为了一个研究难点,也成为了当前一个研究热点。通常,收集和获取各种数据集特别是异质数据集是容易的,但如何从异质数据集中进行知识发现却是困难的。首先,如何定义异质是一个很困难的问题,这导致在异质数据集中进行知识发现也很困难。其次,即使针对有定义的异质数据集,如何在此数据集中进行知识发现(例如,关联规则挖掘)也不是一个容易的问题。由于主(客)户数据库通常被不同的用户基于不同的数据模型独立设计的,而且不同的用户对自己所处理的数据库采用各自的视点和表达方式,使得它们之间存在一定的差异和冲突,导致异质数据集的数据挖掘非常困难。
发明内容
本发明的目的在于提供一种挖掘效率高,解决异质数据集的数据挖掘问题的基于枸杞质量决策树的数据挖掘方法。
为解决上述技术问题,本发明通过下述技术方案得以解决:一种基于枸杞质量决策树的数据挖掘方法,基于决策树的数据挖掘方法包括:
步骤一,对汇总的枸杞质量数据统计分析,获得真实数据;
步骤二,基于真实数据构建决策树;
步骤三,数据归一化:将目标数据集合内的数据进行归一化,将归一化过程中删除的数据进行原始位置标记,并存入数据缓冲集合;
步骤四,结果判断:根据数据归一化的结果,从决策树中选取相应决策。
一种基于枸杞质量决策树的数据挖掘方法,基于真实数据构建决策树的过程包括:根据真实数据的元素特征确定其归属的数据类型,根据数据类型为决策树上的节点分配对应的变量;建立该变量与地址之间的对应关系,在地址中存放数据类型对应的真实数据。
进一步的,所述根据所述数据类型为决策树上的节点分配对应的变量的过程包括:数据类型分组之间的差异最大的原则将真实数据进行切分,每次切分的真实数据分配一个变量,并对应分配一个节点。
进一步的,步骤一,包括对数据统计分析;采用多元回归统计分析方法,其处理过程为:分为三个阶段:搜集数据、分析数据和进行推理。
进一步的,步骤二,通过递归分割的过程来构建决策树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亳州中药材商品交易中心有限公司,未经亳州中药材商品交易中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810434080.X/2.html,转载请声明来源钻瓜专利网。