[发明专利]一种基于低秩表示的地铁异常流量检测方法有效
申请号: | 201711270712.5 | 申请日: | 2017-12-05 |
公开(公告)号: | CN107992449B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 王立春;王学慧;张勇;汪洋;尹宝才 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06F17/16;G06F17/18;G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 表示 地铁 异常 流量 检测 方法 | ||
1.一种基于低秩表示的地铁异常流量检测方法,其特征在于,包括以下步骤:
步骤1、获取站点进出流量数据矩阵;
步骤2、构建时序变化的异常检测低秩模型;
步骤2所述异常检测低秩模型为:
其中,D为原始流量数据矩阵,X表示原始流量数据矩阵的无异常部分,A表示原始流量数据矩阵的异常部分,其中,X具备低秩特性,A具备稀疏特性;||X||*项约束无异常流量的低秩特性,||A||1项约束异常流量的稀疏特性,F=Toeplitz(0,1,-1),λ1与λ2为平衡因子,
引入变量L,Q,S使得X=LQ,S=XFT,(4)式被写为:
将(5)式转化为无约束问题,其增广拉格朗日函数被定义为:
其中Y1、Y2和Y3中的每个元素表示一个拉格朗日乘子,变量μ0为调节三个误差项的权重参数;以下(7)-(11)为迭代求解X,A,S,L,Q,使总误差向减小的方向变化,每次迭代求解出X,A,S,L,Q之后,更新Y1、Y2和Y3,当最终误差小于ε时迭代结束,ε是设定的迭代停止条件,
L(i+1)=(μiXi+Yi)(2E+μiQiTQi)-1 (10)
Q(i+1)=((2E+μiLiTLi)-1(μiLiTXi+LiTYi))T (11);
步骤3、基于聚类方法进行异常聚类分析分组;
步骤3具体为:对异常使用k-means方法进行时空聚类,
聚类步骤如下:
Step1:在分解出的异常矩阵A中,经过一定的阈值筛选后,的点都视为异常点,提取每个异常点的空间信息,时间信息和进出站异常流量值,异常点j的特征向量为Fj=(sj,tj,ej,oj),对站点进行编号,m个连续站点的编号即为1~m,sj∈{1,2,...,m},对连续的时间点也进行编号,n个连续的时间点为1~n,tj∈{1,2,...,n}ti∈{1,2,...,n};
Step2:对每一维数据进行归一化;空间信息值s和时间信息值t映射到[0,1]之间,异常值e和o映射到[-1,1]之间;
Step3:从异常点特征向量集中选择k个异常点作为聚类中心;
Step4:迭代计算每个异常点的欧式距离到聚类中心的距离,直到达到最大迭代次数或收敛;
Step5:采用Calinski-Harabasz准则确定最优分类数,如下(12)式所示,
其中,N为总的样本数,m为所有点的中心点,mz为第z类的中心点,x为类中的样本点,cz为聚出的第z类,nz为cz类中的样本数,SSB是类间方差,SSW是类内方差,(N-k)/(k-1)是复杂度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711270712.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种计算机房光纤布线装置
- 下一篇:基于正则化的信息分析方法