[发明专利]一种在线高维不平衡流数据的学习方法在审
申请号: | 201810732705.0 | 申请日: | 2018-07-05 |
公开(公告)号: | CN109102077A | 公开(公告)日: | 2018-12-28 |
发明(设计)人: | 胡冀;颜成钢;彭冬亮;吴建锋 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06N99/00 | 分类号: | G06N99/00;G06K9/62 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 雷仕荣 |
地址: | 310018*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流数据 截断 特征权重 在线学习 高维 分类算法 分类问题 输入参数 样本输入 在线分类 初始化 贡献量 更新 算法 学习 分类 优化 | ||
1.一种在线高维不平衡流数据的学习方法,其特征在于,包括以下步骤:
步骤S1:输入参数并初始化在线学习模型;
步骤S2:将当前样本输入在线学习模型;
步骤S3:利用在线不平衡流数据分类算法更新权值;
步骤S4:对权值中特征权重进行截断并重新更新权值;
其中,所述步骤S4进一步包括:
设定截断步长K,每K步执行特征权重截断算法对权值进行更新;
其中,特征权重截断算法为:
其中,wj为权值中的向量特征;a为偏置;θ为阈值。
2.根据权利要求1所述的在线高维不平衡流数据的学习方法,其特征在于,所述步骤S3中,所述步骤S3进一步包括:
步骤S31:通过学习模型获取预测标签值,其中,该模型符合高斯分布N(u,∑);
步骤S32:获取当前样本的标签并与步骤S2中获取的预测标签值相比较,如果两者不一致,则执行步骤S33,否则,继续输入下一个样本;
步骤S33:根据当前样本的标签获取代价敏感参数并利用代价敏感参数对权值进行更新;
其中,所述步骤S33进一步包括以下步骤:
步骤S331:如果样本的标签为正,则设定代价敏感参数为C+;如果样本的标签为负,则设定代价敏感参数为C-;
步骤S332:根据代价敏感参数更新高斯分布的参数,也即,根据公式(1)求解KL距离最小的均值参量μt+1和协方差参量Σt+1作为更新值:
其中,Ccs为代价敏感参数,其值为C+或C-;
DKL(·)为KL距离的描述,N(μ,Σ)为模型的高斯分布,N(μt,Σt)为当前样本的高斯分布;
为损失函数,用于度量误分类的概率,(xt,yt)为当前样本;
步骤S333:根据更新后的高斯分布更新当前权值wt+1。
3.根据权利要求2所述的在线高维不平衡流数据的学习方法,其特征在于,所述步骤S3中,利用置信度加权算法计算均值参量μt+1和协方差参量Σt+1。
4.根据权利要求3所述的在线高维不平衡流数据的学习方法,其特征在于,所述代价敏感参数Ccs根据流数据不平衡率设置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810732705.0/1.html,转载请声明来源钻瓜专利网。