[发明专利]一种基于改进的LCSS算法的海量轨迹相似度计算方法在审
申请号: | 202010285620.X | 申请日: | 2020-04-13 |
公开(公告)号: | CN111523577A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 刘宇;耿鑫;李国栋;李维 | 申请(专利权)人: | 南京烽火星空通信发展有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/26 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 lcss 算法 海量 轨迹 相似 计算方法 | ||
本发明公开了一种基于改进的LCSS算法的海量轨迹相似度计算方法,包括:基于采集设备采集移动对象实时位置信息,得到轨迹数据;对得到的轨迹数据进行校验;将经过校验的轨迹数据接入HBASE数据库;通过web前端输入要查询的对象轨迹的相似轨迹及其具体日期,根据对象ID查询出对象当天轨迹;将对象当天轨迹T_0以参数形式下发给大数据平台,大数据平台调度任务后启动MR任务计算相似度。本发明改进现有LCSS算法在计算轨迹点相似度的时候出现对时间阈值选取敏感的问题;解决了大数据集情况下,轨迹相似度计算的实时性问题;实现了挖掘并展示对象的关联轨迹的效果。
技术领域
本发明公开了一种基于改进的LCSS算法的海量轨迹相似度计算方法,涉及互联网信息技术领域。
背景技术
在现有的对象轨迹信息定位处理方法中,由于采集设备采集移动对象位置信息时,会出现采样不均匀问题,导致在计算对象之间的轨迹相似度的时候,要从全局最优的角度上来匹配轨迹之间的相似度。
现有技术中传统的LCSS算法,在轨迹点比对时,会出现对时空轨迹点时间差阈值选取时敏感性的问题。同时,由于对象轨迹数据量较大,若在计算轨迹相似度的时候在单机上运行算法,运算速度会显得比较慢,计算所需要的时间较长,导致系统的实时性较差。
发明内容
本发明所要解决的技术问题是:针对现有技术的缺陷,提供一种基于改进的LCSS算法的海量轨迹相似度计算方法,通过特定算法对移动对象轨迹信息进行相似度计算,基于该算法可以得到对象的潜在时空关系对象,进而完善对象的时空关系图谱。本发明中,改进的LCSS算法定义为LCSS+,该算法从使轨迹点相似性之和最大为目标,克服了对于时间阈值敏感的问题,在平均情况下优于LCSS算法,比LCSS算法更加精确。同时,本发明利用Hadoop集群充分发挥机器的运算能力,使用MapReduce作为其计算框架,将计算任务分而治之,从而缩短计算所需要的时间,并设计实现了分布式的LCSS+算法,进一步的提升系统的实时性。
本发明为解决上述技术问题采用以下技术方案:一种基于改进的LCSS算法的海量轨迹相似度计算方法,包括如下步骤:
步骤一、通过采集设备采集移动对象实时位置信息,得到轨迹数据;
步骤二、对得到的轨迹数据进行校验,判断获取的位置信息中必要字段是否有值且格式正确,如果无值或非格式正确那么舍弃该条数据;
步骤三、将经过校验的轨迹数据接入HBASE数据库;
步骤四、通过web前端输入要查询的对象轨迹的相似轨迹及其具体日期,根据对象ID查询出对象当天轨迹;
步骤五、将对象当天轨迹T0以参数形式下发给大数据平台,大数据平台调度任务后启动MR任务计算相似度。
进一步的,步骤五中所述启动MR任务计算相似度的具体步骤包括:
501、将对象轨迹数据中的各个轨迹点规约到对象身上,形成完整的轨迹,在展示端以轨迹身份证号为key,对象经度、纬度、时间为value进行输出;
502、得到对象的轨迹后,对轨迹点在时间上进行分段;
若时间段内有多个轨迹点,则针对时间、经度、纬度分别求中心点,直至使得在时间段内只有一个轨迹点,形成处理后的轨迹T1;
对轨迹T1和轨迹T0在时间上进行求交运算,各自取公共的出现时间的轨迹点;
运用LCSS+算法对轨迹相似度进行计算,以对象ID为key,轨迹相似度为value进行输出;
503、求得与指定对象轨迹相似度大于设定阈值的k个对象,求解完成后输出结果入存储库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火星空通信发展有限公司,未经南京烽火星空通信发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010285620.X/2.html,转载请声明来源钻瓜专利网。