首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于AWE-OTLMS-RC-OTL的数据流分类算法在审

申请号：	201910925989.X	申请日：	2019-09-27
公开（公告）号：	CN110659695A	公开（公告）日：	2020-01-07
发明（设计）人：	赵兴昊;王松;胡燕祝	申请（专利权）人：	北京邮电大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	暂无信息	代理人：	暂无信息
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	漂移分类准确率数据流分类基分类器构建加权机器学习领域分类概率分类误差分类效果数据分析无效数据下降现象数据流错误率分类器检测准确率整合算法剔除样本判定重现迁移输出分类
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.本发明一种基于AWE-OTLMS-RC-OTL的数据流分类算法，其特征在于：(1)计算每个基分类器分类误差；(2)计算无效数据检测及剔除函数；(3)构建基分类器；(4)加权整合输出分类概率；(5)判定概念漂移样本错误率；(6)构建新的加权分类器；具体包括以下六个步骤：

步骤一：计算每个基分类器分类误差E_rr：

把数据流分成不同的序列，通过交叉留一取样的方式训练不同基分类器的分类误差E_rr，如下公式所示：

式中，E_rr表示分类器的期望误差，A(b)表示较差取样时较差样本数目，f_b是b的密度函数，b表示分类器的边界与最优边界的差值；

步骤二：计算无效数据检测及剔除函数f(x,p)：

剔除目标领域中使用数据中的无效数据，大幅度提高分类器的分类效果，公式如下所示：

式中，p^v,pⁱ表示分类数据权重，且表示常规原始分类器，此处取的SVM分类器，其中S_i中的i表示样本的取样组数；

步骤三：构建基分类器f^T：

构建基分类器，并通过优化函数对分类器进行优化，获得最优化的基分类器，如下公式所示：

式中，{(x_i,y_i)|X×Y|i＝1,...,t}表示数据集向量，α_i表示数据量的一个调节参数，H表示定义在核函数k(x_i,x)上的希尔伯特空间的重构，C表示一个交换参数，l(f^T(x_t),y_t)表示铰链损耗函数；

步骤四：加权整合输出分类概率

获得基分类器分类误差后，通过加权平均的方式对基分类器整合获得集成分类器分类输出，如下公式所示：

式中，表示第c类中第y个实例的分类概率，ω_i表示第i个分类器的权重，这里假设跟第分类误差成反比；

步骤五：判定概念漂移样本错误率e：

预先给定一个阈值F_Thresh，当F_Thresh＜e的时候认为窗口疑似发生概念漂移现象，这个时候则构建新的集成分类器，公式如下所示：

式中，Nerr表示当前分类器对前半段窗口样本的分类错误数量，p为当前窗口长度；

步骤六：构建新的加权分类器f：

当数据流发生概念漂移现象时，通过计算最近的样本与存储的各历史分类器之间的领域相似度，以选择最适合对后续样本进行学习的源分类器，如下公式所示：

式中，α₁,α₂表示分类器权重系数，新建分类器是初始化为w_s,w_t为基分类器加权为集成分类器f时的权重系数，新建分类器是w_t＝0。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学，未经北京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910925989.X/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于机器学习的柑橘果蒂的检测方法
下一篇：用于检测行车安全的方法及装置

同类专利

专利分类

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top