[发明专利]基于加权混合孤立森林的无线传感网络异常数据检测方法有效
申请号: | 201810563300.9 | 申请日: | 2018-06-04 |
公开(公告)号: | CN108777873B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 李光辉;许欧阳 | 申请(专利权)人: | 江南大学 |
主分类号: | H04W24/06 | 分类号: | H04W24/06;H04W84/18 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 李广 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 加权 混合 孤立 森林 无线 传感 网络 异常 数据 检测 方法 | ||
本发明涉及基于加权混合孤立森林的无线传感网络异常数据检测方法,该方法利用传感器节点采集的历史数据集,首先以孤立森林算法为基础构造一定规模的孤立树集合iforest,在其各叶子节点上引入待测样本与其各类样本中心的距离信息,并结合多样性度量对孤立树进行权值系数的设定,最终利用改进的孤立森林算法对无线传感网络数据异常情况进行判定。通过对各传感器节点数据集进行实验,结果表明,本发明提出的算法提高了异常检测的精度,具有广阔的应用前景。
技术领域
本发明涉及无线传感器网络数据可靠性领域,特别是涉及基于加权混合孤立森林的无线传感网络异常数据检测方法。
背景技术
数据作为无线传感网络中的载体,通常都有很多有用的信息,尤其是异常数据中潜在更多信息的暗示(除去节点本身故障),因此,想要了解各类事物的变化规律,就必须通过各种异常检测技术找出异常数据,并通过它们获取对我们有帮助的信息知识。在各领域异常检测技术作为近年较为深入研究的问题,无线传感器网络独特的特点及严格的约束条件使得该问题的研究更具有挑战性。针对无线传感器网络中异常数据的检测问题,目前已有很多种方法,按检测手段可分为基于统计学原理、基于近邻、基于聚类、基于分类以及基于谱分解的方法。此外,按照传感器网络体系结构异常检测技术又可以分为集中式的和分布式的。
F.T.Liu等人提出的孤立森林算法在数据异常检测中具有广泛应用,该算法主要是通过对历史数据集构建孤立树集成模型,并以测试样本的平均搜索深度计算其异常分值s(Y),对当前检测样本集的异常分值降序排列并取前一定数目的样本作为检测出来的异常值,从而决定其异常与否。该方法的优点是原理简单、算法复杂度较低且检测精度理想,但其对于一些凹面数据集的异常检测适用性较低,并且忽略了森林中各棵树对最终异常分值的计算所给予的贡献应当不同,该方法在无线传感器网络异常数据检测应用中尚未见到。
现有技术文献如下:
F.T.Liu,K.M.Ting and Z.H.Zhou,Isolation-based Anomaly Detection,TKDD,2011.
Aryal S,Kai M T,Wells J R,et al.Improving iForest with Relative Mass[C]//Pacific-Asia Conference on Knowledge Discovery and Data Mining.Springer,Cham,2014:510-521.
MarteauP F,Soheily-Khah S,BéchetN.Hybrid Isolation Forest-Applicationto Intrusion Detection[J].2017.
发明内容
基于此,有必要针对上述技术问题,提供一种基于加权混合孤立森林的无线传感网络异常数据检测方法,该方法利用传感器节点采集的历史数据集,首先以孤立森林算法为基础构造一定规模的孤立树集合iforest,在其各叶子节点上引入待测样本与其各类样本中心的距离信息,并结合多样性度量对孤立树进行权值系数的设定,最终利用改进的孤立森林算法对无线传感网络数据异常情况进行判定。通过对各传感器节点数据集进行实验,结果表明,本发明提出的算法提高了异常检测的精度,具有广阔的应用前景。
一种基于孤立森林的异常数据检测方法,包括:
步骤1:以数据集中训练数据集构建Whiforest中的子模型即孤立树,包括参数bootstrap采样数ψ、森林规模大小T、权值系数阈值μ、验证样本集Val_W大小和已知异常样本添加率ratio的设定;
步骤2:随机选取少量已知异常样本加入到已经训练完毕的Itrees中;
步骤3:计算每棵树的叶子结点中的训练样本中心Cen-s,以及每个待测样本x在叶节点中与上述的Cen-s间的距离,将其在森林中的每棵树的均值记作sc(x);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810563300.9/2.html,转载请声明来源钻瓜专利网。