[发明专利]轨迹相似度确定方法和装置有效
申请号: | 201910851151.0 | 申请日: | 2019-09-06 |
公开(公告)号: | CN110555061B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 杨双全;刘畅;谢奕 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/29 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王一;武晨燕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轨迹 相似 确定 方法 装置 | ||
本申请公开了轨迹相似度确定方法,涉及数据挖掘分析领域。具体实现方案为:根据目标对象行为数据中的位置信息和时间信息,在时空坐标系中构建第一行为轨迹和第二行为轨迹;基于第一行为轨迹的各轨迹点,计算第二行为轨迹转换到第一行为轨迹的最小编辑距离;根据最小编辑距离,确定第一行为轨迹与第二行为轨迹的相似度。本申请利用位置信息和时间信息在时空坐标系中构建行为轨迹,并基于最小编辑距离的方式对两个行为轨迹的相似度进行计算,因此能够更加准确的得到目标对象的行为轨迹相似度。
技术领域
本申请涉及一种数据处理领域,尤其涉及一种数据挖掘分析领域。
背景技术
在目前的目标对象行为数据研究方案中,通常是将目标对象行为数据投影到二维平面坐标系内进行目标对象行为轨迹的构建和分析。然而这种方式忽略了时间因素对目标对象行为轨迹所产生的影响。尤其是当目标对象长时间处于同一位置时,如果不考虑时间因素,其空间位置是始终没有发生变化的,反映在坐标系中仅为一个点。而在考虑时间因素的研究方案中,由于不同行为数据的获取时间不同,同一时间节点上可能会出现无对应数据的情况,从而导致生成的行为轨迹无法准确的进行相似度研究。
发明内容
本申请实施例提供一种轨迹相似度确定方法和装置,以解决现有技术中的一个或多个技术问题。
第一方面,本申请实施例提供了一种轨迹相似度确定方法,包括:
根据目标对象行为数据中的位置信息和时间信息,在时空坐标系中构建第一行为轨迹和第二行为轨迹;
基于第一行为轨迹的各轨迹点,计算第二行为轨迹转换到第一行为轨迹的最小编辑距离;
根据最小编辑距离,确定第一行为轨迹与第二行为轨迹的相似度。
本实施例利用位置信息和时间信息在时空坐标系中构建行为轨迹,并基于最小编辑距离的方式对两个行为轨迹的相似度进行计算,因此能够更加准确的确定目标对象的行为轨迹相似度。
在一种实施方式中,基于第一行为轨迹的各轨迹点,计算第二行为轨迹转换到第一行为轨迹的最小编辑距离,包括:
在第一行为轨迹上确定第一目标轨迹点;
在第二行为轨迹上生成第二目标轨迹点,第二目标轨迹点与第一目标轨迹点的坐标相同;
根据预设编辑距离算法,计算生成第二目标轨迹点的第一编辑距离;
利用递归求解算法,计算第二目标轨迹点之前的第二行为轨迹转换到第一目标轨迹点之前的第一行为轨迹的第二编辑距离;
根据第一编辑距离和第二编辑距离,计算第二行为轨迹转换到第一行为轨迹的最小编辑距离。
本实施例通过在第二行为轨迹上生成第二目标轨迹点,弥补了目标对象行为数据不足,导致的第二行为轨迹缺失进行相似度比较的轨迹点的问题。
在一种实施方式中,基于第一行为轨迹的各轨迹点,计算第二行为轨迹转换到第一行为轨迹的最小编辑距离,包括:
在第一行为轨迹上确定第三目标轨迹点和第四目标轨迹点;
去除第二行为轨迹上的冗余轨迹点,冗余轨迹点为时间坐标处于第三目标轨迹点与第四目标轨迹点的时间坐标之间的的轨迹点;
根据预设编辑距离算法,计算去除冗余轨迹点的第三编辑距离;
利用递归求解算法,计算冗余轨迹点之前的第二行为轨迹转换到第三目标轨迹点之前的第一行为轨迹的第四编辑距离;
根据第三编辑距离和第四编辑距离,计算第二行为轨迹转换到第一行为轨迹的最小编辑距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910851151.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于成对样本匹配的迁移学习方法
- 下一篇:一种出入量统计系统