[发明专利]基于不确定连续属性的决策树分类器构建方法在审

申请号：	201610542924.3	申请日：	2016-07-11
公开（公告）号：	CN106611191A	公开（公告）日：	2017-05-03
发明（设计）人：	金平艳;胡成华	申请（专利权）人：	四川用联信息技术有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	暂无信息	代理人：	暂无信息
地址：	610054 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于不确定连续属性决策树分类构建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及机器学习、人工智能以及数据挖掘领域，具体涉及一种基于不确定连续属性的决策树分类器构建方法。

背景技术

决策树研究是数据挖掘和机器学习中的一项重要和积极的研究课题。其所提出的算法被广泛地应用于实际问题当中，如ID₃，CART和C4.5，此类算法主要是研究准确率的问题。随着科学技术的进步，近年来，不确定数据频繁地出现在现实应用中，包括无线传感器网络、无线射频识别、隐私保护等领域。其数据特点是数据值并非是确定的，即表示一个数据点，其表示方式是将多种取值作为一个整体，按照某种概率分布作为每个取值对应出现可能性，其越来越频繁的出现促使相关的研究得到了广泛关注和快速发展。而传统数据挖掘技术中往往忽略了数据中的不确定性，其研究模型与客观世界不符。所以不确定数据挖掘技术对数据挖掘技术的实际应用有着重要意义。属性的不确定性包括离散属性和连续属性，在训练和测试的过程中，为了保证有效的评估模型，验证分类器的性能，数据集中的类别都是已知的。这里主要是针对于不确定连续属性的分类与预测，另外由于测量仪器受精度的影响，采集的数据往往包含一定的误差，不是完全准确的，为了提高不确定连续属性的分类准确率，本发明提出基于不确定连续属性的决策树分类器构建方法。

发明内容

针对于解决不确定连续属性分类与预测的问题以及提高对其分类、预测的准确率问题，本发明提出了基于不确定连续属性的决策树分类器构建方法。

为解决上述问题，本发明是通过以下技术方案实现的：

基于不确定连续属性的决策树分类器构建方法，包括如下步骤：

步骤1：设不确定连续属性训练集中有X个样本，属性个数为n，即n＝(S₁，S₂，…S_n),同时分裂属性S_i对应了m个类L，其中L_r∈(L₁，L₂…，L_m),i∈(1，2…，n)，r∈(1，2…，m)。S_i∈(S₁，S₂，…S_n)，其中属性值具有连续不确定性。