[发明专利]一种UASNs中基于孤立森林的信任模型有效
申请号: | 201910732926.2 | 申请日: | 2019-08-09 |
公开(公告)号: | CN110536258B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 杜嘉欣;韩光洁;林川;徐甜甜;王照辉 | 申请(专利权)人: | 大连理工大学 |
主分类号: | H04W4/38 | 分类号: | H04W4/38;H04W12/60;H04W12/122 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 uasns 基于 孤立 森林 信任 模型 | ||
1.一种UASNs中基于孤立森林的信任模型构建方法,其特征在于,步骤如下:
(1)将水下传感器网络中的n个节点随机部署,对网络节点聚类得到k个簇,簇头负责收集网络中节点的信任属性,在每个时间周期T发送节点通信的信任相关属性给水面的基站sink节点;
(1.1)水下传感器网络中的n个节点具有相同的初始能量、计算、存储能力与通信半径r,当两个节点部署位置之间的距离小于通信半径时直接通信,采用谱聚类算法根据网络中节点的位置对全网的节点聚类,将网络部署区域分为k个簇,同一个簇内的簇成员可进行多跳通信,不同簇之间通过簇头交换数据与控制信息;
(1.2)在每个时间周期T内,网络中的k个簇均基于节点的剩余能量与连通性选举最优簇头,簇头收集簇成员节点通信过程中的信任属性,在每个时间周期结束时发送到基站;
(2)基站接收k个簇头发送的节点信任属性,分别从通信、数据、能量与环境四个方面进行信任计算,采用孤立森林算法检测异常节点,并对节点的可信性做出判断并决策;
(2.1)通信信任的计算采用Beta分布来模拟两个节点交互的先验分布,将水下传感网中某个节点与其他相邻节点之间的通信简化为成功与失败两种情况,表示为函数:
其中,a与b分别为交互成功与交互失败的通信次数;
当不存在先验知识时,节点通信行为采用均匀分布表示为p(x)=uni(0,1)=Beta(1,1),随着通信次数增加,根据通信的成功与失败相应增加a与b的取值,则后验概率分布服从参数为(a+1,b+1)的Beta分布,节点i的通信信任表示为概率密度分布的期望值:
(2.2)数据信任用来表示对数据一致性与错误容忍的评估,从而区分伪造数据与异常数据,由于在一定时间内,网络中相邻节点对某个监测事件的数据反馈总是具有时空相关性,假设数据信息Xdata符合正态分布,概率密度函数为为一个数据项的值,μ与δ分别为数据Xdata的均值与方差,为了评估单个节点对于整体数据分布的差异性,首先利用最小二乘法对实际数据{xi,yi},i=1,2,3,...,n进行参数估计,yi为数据项xi在网络中实际得到的概率,得到拟合函数;
将准则函数表示为:
常数A为幅度,设ex'=y',则x'=lny',重新定义准则函数为:
则变成{xi’,ln(yi’)}是一元二次最小二乘拟合求解,设拟合结果为p1xi'2+p2xi'+p3=ln(yi'),则参数估计值为:
根据完成的分布拟合结果得到实际数据的概率密度函数f(x),理论上,越接近分布中心值的数据可信度越高,所以将节点i与整体数据分布的差异性定义为
除了评估单个节点与整体数据分布情况之外,网络整体的数据分布也会对节点信任值产生影响,由于数据传输的不确定性,使用相对熵来度量节点实际产生的数据与理论上整体数据空间分布的相似性,q(x)为数据项的真实概率分布,根据实际得到的数据值计算,相对熵的取值大于等于0,当q(x)与f’(x)相等时,相对熵等于0成立,相对熵越大,两个数据差异性越大,越小表示f与q分布越接近,也就是di越大越好,DKL(q||f')DKL(p||f)越小越好,所以数据信任的计算结合数据整体分布实际与理论分布的相似性DKL(q||f')和单个数据点与整体拟合点的差异性di,表示为:
(2.3)由于在水下传感网中,节点能量受限,而水下节点充电困难,将能量作为影响水下节点的一个信任因素,一方面,能量表示一个节点完成任务的能力指标,另一方面,一些恶意攻击会导致节点的能量消耗异常,能量反映一个节点的可信性,将节点的能量信任为定义为能量消耗率:
其中,为节点i的剩余能量,E为所有传感节点的初始能量;
(2.4)由于水下环境会影响节点间的通信,只考虑节点间成功与失败的通信、能量基本信任属性不能全面地反映对某节点的可信度,因此将环境信任表示为水下信道中的噪声功率谱密度psd,psd取决于频率f,将环境噪声源分为四类,总噪声功率谱密度被线性建模为:
其中,Nt(f),Ns(f),Nw(f),Nth(f)分别表示湍流、船只活动、风与热气流产生的噪音:
其中,s=0.5表示中等船只活动,w=5[m/s]表示风速;
(3)将以上通信、数据、能量与环境四种信任项作为信任训练集,根据水下传感网的特性选择孤立森林作为异常检测算法,基于训练得到的信任模型,评估网络中节点的异常分数,异常分数值高的节点被视为异常节点;
(3.1)综合考虑环境、应用场景与算法的特点,选择孤立森林作为异常检测算法;
(3.2)在孤立森林中,递归地随机分割数据集,直到所有的样本点都是孤立的,直观上来讲,那些密度很高的簇是被切很多次才会停止切割,但是那些密度很低的点容易较早被孤立为一个子空间,在这种随机分割的策略下,异常点通常具有较短的路径;
给定m个样本数据X={x1,x2,...xm},特征的维度为d,为了构建一棵孤立树iTree,需要随机选择一个特征维度q与分割值p,递归地分割数据集X,设N为孤立树的一个节点,它要么是没有子节点的叶子节点,要么是只有两个子节点(Nl,Nr)的内部节点,每一步分割,将qp的数据分到Nl,将q≥p的数据分到Nr,直到满足以下任意一个条件:(1)树达到了限制的高度;(2)节点上只有一个样本;(3)节点上的样本所有特征都相同,获得t个iTree之后,孤立森林iForest训练结束,然后用生成的iForest来评估测试数据;
(3.3)在训练阶段,通过对训练集递归分类建立iTree,树的高度限制l与子采样大小ψ的关系为l=ceiling(log2(ψ)),近似于树的平均高度,由于异常点是路径长度较小的点,在算法中不关注路径长的正常点,iForest算法有两个输入参数,子采样大小ψ和树的数量t,子采样大小控制训练数据大小,根据经验设置为28,树的数量t控制整体大小,通过实验验证路径长度通常在t的某个取值之前收敛,培训过程结束时,返回一组孤立树,训练iForest的复杂度是O(tψlogψ);(3.4)在评估阶段,通过异常分数评估节点的异常程度,异常分数值越大,异常可能性越高,一个测试样本x的异常分数为其中h(x)是路径程度,E(h(x))是h(x)的期望值,c(m)是iTree的平均路径长度,由于孤立树与二叉查找树的相似性,采用二叉查找树中不成功查找的平均路径长度估计c(m)=2H(m-1)-(2(m-1)/m),其中H(i)是调和数,为ln(i)+0.5772156649,评估过程的复杂度是
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910732926.2/1.html,转载请声明来源钻瓜专利网。