[发明专利]一种基于AAE-DWMIL-LearnNSE的数据流分类算法在审
申请号: | 201910929480.2 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110647671A | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 赵兴昊;王松;胡燕祝 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据流分类 训练样本 新数据 分类 机器学习领域 综合预测模型 分类错误率 分类准确率 集成分类器 标签测试 存储空间 分类模型 函数确定 基分类器 加权处理 加权合成 目标领域 数据挖掘 数据样本 有效解决 数据流 分类器 相似度 源领域 度量 权重 算法 样本 标签 保存 更新 环节 | ||
1.本发明一种基于AAE-DWMIL-LearnNSE的数据流分类算法,其特征在于:(1)更新每个分类器权重;(2)加权处理基分类器;(3)加权合成集成分类器;(4)计算新数据集上分类错误率;(5)综合预测模型;(6)数据流分类函数确定及分类;具体包括以下七个步骤:
步骤一:更新每个分类器权重
首先对于每个基分类器的分类错误率ε进行计算,根据分类错误率对每个基分类器的权重ω进行初始值的设置,如下公式所示:
式中,j=1,...,m+1,m表示分类器的数据,t表示时间轴,表示在当前的数据流中第j个分类器的分类错误率,其中通过F1或者G-mean方式进行计算;
步骤二:加权处理基分类器
使用sigmoid对基分类器加权处理,减少分类器错误率引起的波动,跟新基分类器的权重,如下公式所示:
式中,a,b为设置sigmoid形态的数值,根据a,b值调整调整基分类器错误率分类性能的大小;
步骤三:加权合成集成分类器Ht(xt(i)):
对各个基分类器进行加权合成一个集成分类器,用于对整个数据流进行分类预测,产生一个初始分类结果,如下公式所示:
式中,表示每个基分类器权重,为减小错误率波动,使用sigmoid函数对每个基分类器所在环境进行加权平均处理;
重复以上步骤,并在训练数据上进行训练,得到初始分类预测模型,整个算法流程图如图2所示;
步骤四:计算新数据集上分类错误率
添加新数据,对分类模型进行预测,并计算相应的错误率的加权,从而对分类器的分类效果进行判断,如下公式所示:
式中,t表示第几次处理的训练集,xt(i)表示所使用的实例,i表示个共mt个,表示实例权重,表示惩罚权重,表示基分类器,当分类错误率大于0.5时表明该基分类器无效,需要重新学习;
步骤五:综合预测模型sign(·):
式中,x表示数据流中的输入数据,即一个分类器的整合向量和权值wt的结合;
步骤六:数据流分类函数确定及分类p(cm|h1,h2,…,hf):
式中,M表示分类器数量,cm表示类数目,p(cm)表示带有特征f实例的后验概率,N表示目前使用的数据流中存储的实例数目,表示第i个数据实例,I(·)表示判别函数,nj表示第j个特征的概率值,i表示训练实例的索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910929480.2/1.html,转载请声明来源钻瓜专利网。