[发明专利]基于Stacking和翻转随机降采样分类方法、系统、介质及设备在审

专利信息
申请号: 201810132427.5 申请日: 2018-02-08
公开(公告)号: CN108416369A 公开(公告)日: 2018-08-17
发明(设计)人: 蒋昌俊;闫春钢;刘关俊;丁志军;张亚英;张裕威;栾文静 申请(专利权)人: 同济大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 上海光华专利事务所(普通合伙) 31219 代理人: 王华英
地址: 200092 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 组件分类 测试样本 分类 集成分类器 原始训练集 训练子集 降采样 翻转 分布特征 分类结果 数据分类 特征组成 不均衡 分类器 区分度 输出 表现
【权利要求书】:

1.一种基于Stacking和翻转随机降采样分类方法,其特征在于,包括:

获取原始训练集,将所述原始训练集划分为数目大于等于两个的不同的训练子集;

为每一所述训练子集建立数目大于等于两个的不同的组件分类器;

将每个所述组件分类器的输出作为特征进行训练,生成集成分类器;

获取测试样本,根据每一所述组件分类器依次分类测试样本得组件分类结果,以所述组件分类结果为特征组成一新测试样本,以所述集成分类器分类所述新测试样本得最终分类结果。

2.根据权利要求1所述的方法,其特征在于,所述获取原始训练集,所述将所述原始训练集划分为数目大于等于两个的不同的训练子集具体包括:

接收所述原始训练集D;

将所述原始训练集D分为多数类样本集合A和少数类样本集合B;

初始化已抽样次数i及降采样次数k;

判断所述已抽样次数i是否小于所述降采样次数k;

若是,则不放回地循环抽取所述多数类样本集合A中的多数类样本,其中每次抽取所述多数类样本的个数n为n=ceil(|B|2/|A|);

以n个所述多数类样本与所有的少数类样本构成一训练子集Di

若否,则结束划分所述原始训练集。

3.根据权利要求2所述的方法,其特征在于,所述为每一所述训练子集建立数目大于等于两个的不同的组件分类器具体包括:

初始化有序集合C;

判断是否已获取k个所述训练子集Di

若是,则训练每一所述训练子集Di得到m个不同的所述组件分类器,循环训练k个所述训练子集Di

若否,则结束所述组件分类器训练;

将所述组件分类器依次放入所述有序集合C中,其中所述有序集合C的样本数目|C|=c,c=m×k;

获取校验集V;

根据每一所述组件分类器对所述校验集V中的校验样本进行分类得校验分类结果;

将所述校验分类结果作为特征生成新数据集D′。

4.根据权利要求3所述的方法,其特征在于,所述将每个所述组件分类器的输出作为特征进行训练,生成集成分类器具体包括:

获取所述组件分类器和所述新数据集D′;

以m种验证算法分别对所述新数据集D′进行m次十折交叉验证;

记录m种所述算法在十折交叉验证中得到m的AUC值;

比较m个AUC值得最大AUC值,得最大AUC值算法;

设定所述最大AUC值算法对应的所述组件分类器为所述集成分类器。

5.根据权利要求1所述的方法,其特征在于,所述获取测试样本,根据每一所述组件分类器依次分类测试样本得组件分类结果,以所述组件分类结果为特征组成一新测试样本,以所述集成分类器分类所述新测试样本得最终分类结果具体包括:

获得测试样本x、包含所有所述组件分类器的集合C和所述集成分类器;

以所述集合C中的每一所述组件分类器依次对所述测试样本x进行分类得所述组件分类结果;

将所有所述组件分类结果依次作为特征组成样本集T;

根据所述集成分类器对所述样本集T分类得所述最终分类结果;

输出所述最终分类结果。

6.一种基于Stacking和翻转随机降采样分类系统,其特征在于,包括:数据处理模块、组件分类器训练模块、集成分类器训练模块和判断模块;

所述数据处理模块,用于获取原始训练集,将所述原始训练集划分为数目大于等于两个的不同的训练子集;

所述组件分类器训练模块,用于为每一所述训练子集建立数目大于等于两个的不同的组件分类器;

所述集成分类器训练模块,用于将每个所述组件分类器的输出作为特征进行训练,生成集成分类器;

所述判断模块,用于获取测试样本,根据每一所述组件分类器依次分类测试样本得组件分类结果,以所述组件分类结果为特征组成一新测试样本,以所述集成分类器分类所述新测试样本得最终分类结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810132427.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top