[发明专利]一种基于VFDT-Boosting-3WD的数据分类方法在审

申请号：	201910891816.0	申请日：	2019-09-20
公开（公告）号：	CN110598798A	公开（公告）日：	2019-12-20
发明（设计）人：	胡燕祝;王松	申请（专利权）人：	胡燕祝
主分类号：	G06K9/62	分类号：	G06K9/62;G06F16/28;G06F16/2458;G06N20/20
代理公司：	暂无信息	代理人：	暂无信息
地址：	100876 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分类结果基础分类数据集算法机器学习领域分类准确率风险决策工作基础集成学习局部节点全局节点数据分类数据挖掘初始化簇结构多节点权重和样本集组分类权重协同挖掘分析
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.本发明提出了一种基于VFDT-Boosting-3WD的数据分类方法，其特征在于：(1)确定数据集，(2)确定数据集的微簇结构，(3)确定算样本集初始化权重和第一个基础分类器，(4)依次建立第t个基础分类器，并改变对应权重，(5)确定组分类器模型，(6)确定最小风险决策规则，具体包括以下六个步骤：

步骤一：确定数据集T；

T＝{x₁,x₂,…,x_n}；

其中，x为数据特征，m表示数据维度；

步骤二：确定数据集的微簇结构M；

M＝<n,c,s,d,f>；

其中，n为样本个数，c表示数据的中心点，s为数据平方和统计，d表示方差统计值，f表示数据的类标识；

步骤三：确定算样本集初始化权重和第一个基础分类器h₁(x)；

式中,n为样本个数，为初始化权重；

步骤四：依次建立第t个基础分类器，并改变对应权重；

β_t＝ε_t/(1-ε_t)；

式中，为第t个样本权重，x_i为第i个预测数据特征，y_i为第i个真实值标签，h_t(x)表示第t个基础分类器，ε_t为初始损失函数，β_t为更新后的损失函数；

步骤五：确定组分类器模型H(x)；