[发明专利]一种使用OPTICS与离线批处理优化的轨迹聚类算法在审
申请号: | 201910942813.5 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110689082A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 陈金勇;郭雨;陈勇;张新宇;李梁;孙未未 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 13124 河北东尚律师事务所 | 代理人: | 王文庆 |
地址: | 050081 河北省石家*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 密度聚类 多组参数 聚类结果 正态分布 批处理 时间复杂度 预处理过程 时空轨迹 一次完成 聚类 离线 算法 时间成本 时间代价 参考 等分点 拟合 合并 替代 转化 优化 | ||
本发明设计了一种使用OPTICS与离线批处理优化的时空轨迹密度聚类算法,能在仅增加极少时间代价的同时,对多组参数同时进行时空轨迹密度聚类,或在参数未知的情况生成可供参考的参数并进行聚类。它使用OPTICS密度聚类替代DBSCAN密度聚类,使对多组参数分别计算,时间成本较高的DBSCAN过程被转化为时间复杂度较高的预处理过程与时间复杂度较低的聚类结果生成过程,其中预处理过程可以一次完成;同时,运用离线批处理思想,合并聚类结果生成过程,使其也能一次完成,从而达到降低计算多组参数对应聚类结果时间的目的。当参数未知时,算法将OPTICS中的聚类对象可达距离拟合到正态分布,在正态分布中取若干等分点作为可供参考的参数数值。
技术领域
本发明涉及一种对时空轨迹序列的密度聚类算法,尤其是一种对参数多组或未知情况下进行聚类的轨迹聚类算法。
背景技术
由于网络技术、社会、商业的进步,诸如GPS定位、传感器、卫星遥感等先进技术的蓬勃发展,使得大量的时空轨迹数据得到积累,如许多基于位置的服务行业,积累了大量用户的出行路线与移动轨迹数据。这些大规模的数据可以弱化数据质量低下的缺点,使得从中提取出隐含的信息,研发出新型应用成为可能,这些服务都建立在对大量时空轨迹数据的简化分析,提取出有效信息的基础上。如何高效地利用这些数据,相应地成为了数据分析的新问题。
轨迹模式挖掘,是通过大量的空间轨迹分析移动物体的移动模式,使其由包含特定模式的单个轨迹或具有相似模式的一组轨迹来表示。为了找到由不同运动物体共享的代表性路径或共同趋势,我们通常需要将类似的轨迹分组为聚类。轨迹聚类在数据分析中发挥了至关重要的作用,因为它揭示了移动物体的潜在趋势。找到这种模式可以用于旅行路线的建议,出行模式的理解,后续位置的预测等应用。
对适于轨迹分析的聚类方法,已有前人做出思考并得出结论:与传统的k-mean聚类相比,基于密度的聚类算法有明显优势。如:聚类结果可以自然扩展形成任意形状;能够发现任意数量的聚类以更好的适应源数据;能够很好地处理数据中的噪声。
学者Jae-Gil Lee在2008年提出了一种基于密度的聚类算法TRACLUS[1],通过轨迹分割、聚类、生成三个步骤,对轨迹聚类并得到了对应的频繁模式。TRACLUS算法不需要考虑轨迹的时间因素,即使一些运动对象从未同时在一起移动,也有可能有被分在同一组聚类。该算法也不以整条完整的轨迹为单位进行聚类,而是通过轨迹分割将轨迹转化为若干条线段,再对线段进行聚类,因此生成的聚类结果更为灵活多变,有其独到之处。TRACLUS的算法思想也被用于轨迹离群点检测,轨迹分类,以及增量聚类。
但TRACLUS在聚类部分时使用传统的DBSCAN算法,需要人为设定参数ε与MinLns密度。由于实际需求的不同,我们可能会需求不同疏密程度的聚类结果,此时参数的设定几乎完全取决于工程师的经验。同时,由于每生成一次聚类结果都需要对所有数据运行一遍完整算法,会消耗大量的时间,这使得在大规模数据集上调试参数显得十分困难。
涉及文献为:
[1]Jae-Gil Lee,Jiawei Han,and Kyu-Young Whang.Trajectory clustering:Apartition-and-group framework.In Proceedings of the 2007ACM SIGMODInternational Conference on Management of Data,SIGMOD’07,pages 593–604,NewYork,NY,USA,2007.ACM.
[2]Mihael Ankerst,Markus MBreunig,Hans-Peter Kriegel,and Sander.Optics:ordering points to identify the clustering structure.In ACMSigmod record,volume 28,pages 49–60.ACM,1999.
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所,未经中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910942813.5/2.html,转载请声明来源钻瓜专利网。