[发明专利]一种基于VFDT-Boosting-3WD的数据分类方法在审
申请号: | 201910891816.0 | 申请日: | 2019-09-20 |
公开(公告)号: | CN110598798A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 胡燕祝;王松 | 申请(专利权)人: | 胡燕祝 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/28;G06F16/2458;G06N20/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类结果 基础分类 数据集 算法 机器学习领域 分类准确率 风险决策 工作基础 集成学习 局部节点 全局节点 数据分类 数据挖掘 初始化 簇结构 多节点 权重和 样本集 组分类 权重 协同 挖掘 分析 | ||
1.本发明提出了一种基于VFDT-Boosting-3WD的数据分类方法,其特征在于:(1)确定数据集,(2)确定数据集的微簇结构,(3)确定算样本集初始化权重和第一个基础分类器,(4)依次建立第t个基础分类器,并改变对应权重,(5)确定组分类器模型,(6)确定最小风险决策规则,具体包括以下六个步骤:
步骤一:确定数据集T;
T={x1,x2,…,xn};
其中,x为数据特征,m表示数据维度;
步骤二:确定数据集的微簇结构M;
M=<n,c,s,d,f>;
其中,n为样本个数,c表示数据的中心点,s为数据平方和统计,d表示方差统计值,f表示数据的类标识;
步骤三:确定算样本集初始化权重和第一个基础分类器h1(x);
式中,n为样本个数,为初始化权重;
步骤四:依次建立第t个基础分类器,并改变对应权重;
βt=εt/(1-εt);
式中,为第t个样本权重,xi为第i个预测数据特征,yi为第i个真实值标签,ht(x)表示第t个基础分类器,εt为初始损失函数,βt为更新后的损失函数;
步骤五:确定组分类器模型H(x);
式中,argmin为目标函数取最小值时的自变量取值,Ls表示损失函数,yi为第i个真实值标签;
步骤六:确定最小风险决策规则(Pli)~(Nli);
(Pli)IF Pr(X|xi)≥αi,THEN xi∈POS(X);
(Bli)IF βi(X|xi)<αi,THEN xi∈BND(X);
(Nli)IF Pr(X|xi)<β,THEN xi∈NEG(X);
式中,POS(X),BND(X),NEG(X)表示三种分类判定动作,三支决策的损失函数由各个动作带来的损失决定,给出相应决策建议,完成数据分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡燕祝,未经胡燕祝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910891816.0/1.html,转载请声明来源钻瓜专利网。