[发明专利]集成学习中有偏数据下基于多步标签变换的Boosting改进方法在审
申请号: | 201810108192.6 | 申请日: | 2018-02-02 |
公开(公告)号: | CN108399457A | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 孙红光;盛敏;李伟民;史琰;李建东;文娟;张琰;刘俊宇 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06N99/00 | 分类号: | G06N99/00 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于数据识别技术领域,公开了一种集成学习中有偏数据下基于多步标签变换的Boosting改进方法,准备训练数据集,测试数据集;针对训练数据集样本原始标签进行有偏性检测和标签变换;采用多阶段标签变换的方式进行Boosting过程迭代,每个阶段训练结束,计算当前阶段下拟合残差,满足变换指标时,进行sigmod压缩变换与boxcox变换;通过及时停止机制确定拟合阶段数目,完成训练过程;通过分阶段对测试数据预测和反变换完成预测过程,得到预测结果。本发明充分缓解了数据有偏性对算法系统带来的影响,提升了算法的灵活性,一定程度上提升了Boosting算法的拟合能力,使得算法表现更加鲁棒。 | ||
搜索关键词: | 标签变换 拟合 训练数据集 集成学习 算法 测试数据集 测试数据 过程迭代 阶段训练 数据识别 算法系统 训练过程 预测结果 原始标签 多阶段 反变换 分阶段 预测 残差 鲁棒 样本 改进 压缩 缓解 检测 表现 | ||
【主权项】:
1.一种集成学习中有偏数据下基于多步标签变换的Boosting改进方法,其特征在于,所述集成学习中有偏数据下基于多步标签变换的Boosting改进方法包括:准备训练数据集,测试数据集;针对训练数据集样本原始标签进行有偏性检测和标签变换;采用多阶段标签变换的方式进行Boosting过程迭代,每个阶段训练结束,计算当前阶段下拟合残差,满足变换指标时,进行sigmod压缩变换与boxcox变换;通过及时停止机制确定拟合阶段数目,完成训练过程;通过分阶段对测试数据预测和反变换完成预测过程,得到预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810108192.6/,转载请声明来源钻瓜专利网。