[发明专利]一种基于VFDT-Boosting-3WD的数据分类方法在审

专利信息
申请号: 201910891816.0 申请日: 2019-09-20
公开(公告)号: CN110598798A 公开(公告)日: 2019-12-20
发明(设计)人: 胡燕祝;王松 申请(专利权)人: 胡燕祝
主分类号: G06K9/62 分类号: G06K9/62;G06F16/28;G06F16/2458;G06N20/20
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分类结果 基础分类 数据集 算法 机器学习领域 分类准确率 风险决策 工作基础 集成学习 局部节点 全局节点 数据分类 数据挖掘 初始化 簇结构 多节点 权重和 样本集 组分类 权重 协同 挖掘 分析
【权利要求书】:

1.本发明提出了一种基于VFDT-Boosting-3WD的数据分类方法,其特征在于:(1)确定数据集,(2)确定数据集的微簇结构,(3)确定算样本集初始化权重和第一个基础分类器,(4)依次建立第t个基础分类器,并改变对应权重,(5)确定组分类器模型,(6)确定最小风险决策规则,具体包括以下六个步骤:

步骤一:确定数据集T;

T={x1,x2,…,xn};

其中,x为数据特征,m表示数据维度;

步骤二:确定数据集的微簇结构M;

M=<n,c,s,d,f>;

其中,n为样本个数,c表示数据的中心点,s为数据平方和统计,d表示方差统计值,f表示数据的类标识;

步骤三:确定算样本集初始化权重和第一个基础分类器h1(x);

式中,n为样本个数,为初始化权重;

步骤四:依次建立第t个基础分类器,并改变对应权重;

βt=εt/(1-εt);

式中,为第t个样本权重,xi为第i个预测数据特征,yi为第i个真实值标签,ht(x)表示第t个基础分类器,εt为初始损失函数,βt为更新后的损失函数;

步骤五:确定组分类器模型H(x);

式中,argmin为目标函数取最小值时的自变量取值,Ls表示损失函数,yi为第i个真实值标签;

步骤六:确定最小风险决策规则(Pli)~(Nli);

(Pli)IF Pr(X|xi)≥αi,THEN xi∈POS(X);

(Bli)IF βi(X|xi)<αi,THEN xi∈BND(X);

(Nli)IF Pr(X|xi)<β,THEN xi∈NEG(X);

式中,POS(X),BND(X),NEG(X)表示三种分类判定动作,三支决策的损失函数由各个动作带来的损失决定,给出相应决策建议,完成数据分类。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡燕祝,未经胡燕祝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910891816.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top