[发明专利]基于时间序列的多维距离聚类异常检测方法及系统在审
申请号: | 201910783824.3 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110490264A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 丁建立;黄天镜;王静;王怀超 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 12101 天津市鼎和专利商标代理有限公司 | 代理人: | 蒙建军<国际申请>=<国际公布>=<进入 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于时间序列的多维距离聚类异常检测方法及系统,属于航空安全技术领域,所述基于时间序列的多维距离聚类异常检测方法包含下列步骤:步骤一:对轨迹数据集进行预处理,所述预处理包括清洗和再整合;步骤二:计算轨迹间多维相似度;步骤三:对于上述多维Hausdorff距离,构造轨迹间相似性矩阵;步骤四:多维hausdorff距离的层次聚类算法;选择机器学习中的层次聚类算法基于上述相似性矩阵进行层次聚类;步骤五:检测算法的异常检测效果,构造出在速度、方向、经度、纬度上有异常的轨迹,通过上述层次聚类算法将异常轨迹与正常轨迹聚类,并选用正确率、精确率、召回率、F1值来评价聚类算法。 | ||
搜索关键词: | 多维 层次聚类算法 异常检测 聚类 预处理 相似性矩阵 时间序列 层次聚类 构造轨迹 轨迹数据 航空安全 机器学习 检测算法 聚类算法 异常轨迹 正常轨迹 经度 相似度 正确率 纬度 整合 清洗 | ||
【主权项】:
1.一种基于时间序列的多维距离聚类异常检测方法,其特征在于,包含下列步骤:/n步骤一:对轨迹数据集进行预处理,所述预处理包括清洗和再整合;具体为:/n使用正则表达式处理明显异常的数据,对于缺失值的数据,若某条数据有多个属性缺失值,选择直接删除该元组,对于各别数据的缺失,则使用平均值来补齐数据;之后,再根据所需特征,从轨迹数据集中到新表,从而达到数据格式标准化;/n步骤二:计算轨迹间多维相似度;具体为:/n轨迹数据表示为TR={P1,P2,…Pi,…,Pn},其中Pi=(loni,lati,vi,θi,ti),loni,lati为轨迹点的经度和纬度值,vi为轨迹点的速度,θi为轨迹点的方向,ti为该轨迹点的时间戳信息;轨迹集合为T={TR1,TR2,…,TRi,…,TRn},其中TRi表示第i条轨迹数据;根据H(A,B)=max(h(A,B),h(B,A)),将速度、方向、经度、纬度融合入Hausdorff距离公式中,计算任意两条轨迹之间的多维Hausdorff距离;/n步骤三:对于上述多维Hausdorff距离,构造轨迹间相似性矩阵;/n步骤四:多维hausdorff距离的层次聚类算法;选择机器学习中的层次聚类算法基于上述相似性矩阵进行层次聚类;具体为:/n首先根据n条轨迹数据构造n个类,每一类的平台高度均为0;/n其次合并距离最近的两类为新类,修改平台高度;/n再次计算新类与当前各类的距离,若类的个数已经等于1,生成具有层次结构的聚类图,否则继续合并类,并计算新类与各类的距离,直到结束;/n步骤五:检测算法的异常检测效果,构造出在速度、方向、经度、纬度上有异常的轨迹,通过上述层次聚类算法将异常轨迹与正常轨迹聚类,并选用正确率、精确率、召回率、F1值来评价聚类算法。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910783824.3/,转载请声明来源钻瓜专利网。