[发明专利]一种基于主动学习的网络数据异常检测方法无效
申请号: | 201110040672.1 | 申请日: | 2011-02-18 |
公开(公告)号: | CN102176701A | 公开(公告)日: | 2011-09-07 |
发明(设计)人: | 张钧萍;何淼;陈雨时;张晔 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;G06K9/62 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 岳泉清 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主动 学习 网络 数据 异常 检测 方法 | ||
1.一种基于主动学习的网络数据异常检测方法,其特征在于它步骤如下:
步骤一:在候选未标注样本集A的未标注样本中选择C个点作为候选聚类中心,将候选未标注样本集A进行迭代优化聚类运算,选取叠代聚类结果中的代表性样本构建训练样本集B;
步骤二:支持向量机在上述构建的训练样本集B上训练得到训练超平面;
步骤三:根据样本选择准则从候选未标注样本集A中选择最能提升分类性能的样本,标注类别后加入训练样本集B中;
步骤四:支持向量机在更新后的训练样本集B上重新训练;
步骤五:若检测精度达到设定值,则结束,否则返回步骤三。
2.根据权利要求1所述的一种基于主动学习的网络数据异常检测方法,其特征在于步骤一中采用迭代优化聚类运算构建训练样本集B的步骤如下:
步骤1:将候选未标注样本集A进行初始化,在多维空间中选择C个点作为候选聚类中心,将这些点记为i=1,2,...,C;
步骤2:在聚类的未标注的样本中,检验每一个未标注样本的位置x,指定未标注样本到最近的候选类中,这种指定方式是根据欧式距离度量进行;
步骤3:根据上一步骤得到的分组,计算得到一组新的均值,记作:mi,i=1,2,...,C;
步骤4:如果对于全部i有则迭代处理停止,否则,利用当前的mi值来更新值,返回步骤2。
3.根据权利要求1所述的一种基于主动学习的网络数据异常检测方法,其特征在于步骤三中采用的样本选择准则是每次选择离分类面最近的一个或者几个样本作为新样本进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110040672.1/1.html,转载请声明来源钻瓜专利网。