[发明专利]一种基于大数据的行迹相似对象识别方法与系统有效
申请号: | 201810299875.4 | 申请日: | 2018-04-04 |
公开(公告)号: | CN108595539B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 于瑞强;王林;刘伯栋;翟特;刘波;杜星学;徐婧;李经帅 | 申请(专利权)人: | 烟台海颐软件股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/23;G06F16/2458 |
代理公司: | 烟台双联专利事务所(普通合伙) 37225 | 代理人: | 张辉 |
地址: | 264006 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 行迹 相似 对象 识别 方法 系统 | ||
本发明属于数据分析领域,涉及一种基于大数据的行迹相似对象识别方法与系统。本发明利用空间归一化模块、数据整理模块、空间点位序列生成模块、行为轨迹序列提取模块、行为矩阵生成模块、行为矩阵运算模块依次连接,对行迹位置原始数据构建行迹标识字典;依据行迹标识字典标准化传入数据;统合属于每个对象的行迹点位数据;构建每个对象在时间窗口内的行迹点位序列;对每个对象的行迹点位序列生成位移轨迹序列;构建行为计算矩阵来计算轨迹相似度;输出行为相似性符合条件的结果。本发明通过获取分析不同对象的空间位置移动信息并利用算法计算不同对象空间位置变化相互间的相似度,探究对象之间的相似性关系、识别及寻找行为相似的对象与群体。
技术领域
本发明属于数据分析技术领域,具体涉及行为相似性数据分析技术领域,尤其涉及一种基于大数据的行迹相似对象识别方法与系统。
背景技术
在电子商务、公共安全等领域,会希望通过分析遍布于四处的大量数据采集设备或用户所访问网络节点等采集到的数据找到与目标人员或群体具有相似行为的对象。使用传统的基于精确位置的行迹匹配方法进行识别时常常有耗时长、疑似数据过多、难以过滤的问题,特别在当今数据量几何式增长的情况下,传统方法基于本地化集中计算的局限性日益突出,越发难以满足需要。
发明内容
针对现有技术中的问题,本发明提供一种基于大数据的行迹相似对象识别方法与系统,通过获取分析不同对象的空间位置移动信息并利用算法计算不同对象空间位置变化相互间的相似度,探究对象之间的相似性关系、识别及寻找行为相似的对象与群体。
为实现上述目的,本发明是通过以下技术方案实现的:
本发明提供一种基于大数据的行迹相似对象识别系统,其特殊之处在于,包括用于对行迹字典数据进行离散化、生成行迹标识字典的空间归一化模块,用于数据准备、数据过滤和清洗、数据标准化的数据整理模块,用于统合对象并对每个对象的行迹点位数据按照空间位置随时间演变的情况进行序列化处理的空间点位序列生成模块,用于提取行为轨迹并序列化的行为轨迹序列提取模块,用于将需要分析的对象数据与全部数据统合并构建行为计算矩阵的行为矩阵生成模块,用于计算行为轨迹序列相似度的行为矩阵运算模块,以及用于对结果进行分析过滤存储的结果整理模块;其中空间归一化模块、数据整理模块、空间点位序列生成模块、行为轨迹序列提取模块、行为矩阵生成模块、行为矩阵运算模块依次连接。
进一步地,所述空间归一化模块用于通过分析作为数据来源的采集设备的位置关系信息,对位置相近的设备进行整合分组并分配点位标识代码,构建用于匹配采集数据中的空间点位信息映射为标识代码的行迹标识字典。
进一步地,所述数据整理模块用于通过行迹标识字典对初始数据进行接收、标准化、整理与整合,并利用分布式存储对初始数据进行特征抽取和数据校验,过滤异常或无效数据,最终将结果包装储存到分布式存储系统中。
进一步地,所述空间点位序列生成模块负责读取数据整理模块处理后的数据并构建行迹点位序列,在空间点位序列生成模块对数据的处理包括统合各个对象的数据,将其行迹点位数据按照时间演变情况进行序列化处理,同时对序列中因长期驻留而产生的噪声数据进行除重。
进一步地,所述行为轨迹序列提取模块通过对序列在时间上相邻的点位进行分析处理,提取空间点位序列生成模块提供的行迹点位序列中的位移特征,即提取每次位移的起点及终点的点位标识代码,构成位移编码,并依照原来的序列重新序列化成位移轨迹序列。
进一步地,所述行为矩阵生成模块负责从行为轨迹序列提取模块提供的位移轨迹序列表中提取待分析数据,每个数据轨迹作为一个元素,构建待分析对象向量,然后将待分析对象向量与全部对象轨迹构成的向量进行笛卡尔积。
进一步地,所述行为矩阵运算模块负责对笛卡尔积得到的矩阵进行计算,计算矩阵每一行各个对象的位移轨迹序列中同步位移序列的长度,即各个对象均发生过的、起止点相同的、发生顺序相同的位移子序列长度,然后与该行对象中位移轨迹序列较长一方的序列长度求商,以此作为二者的行迹相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台海颐软件股份有限公司,未经烟台海颐软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810299875.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于区块链的键值数据组织方法及系统
- 下一篇:一种文件的显示方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置