[发明专利]一种通过日志轨迹对不同采集特征进行关系分析的方法在审
申请号: | 201910322241.0 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110059141A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 陈陵;徐洪;周华雄;王国辉;李松洲;孙宇飞;郭晓东 | 申请(专利权)人: | 珠海网博信息科技股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/50 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 519000 广东省珠海市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采集 日志 采集设备 关系分析 相似度 归类 分析 轨迹相似度 向量相似度 有效地减少 技术效果 人工方式 日志数据 数据关联 算法获取 业务逻辑 数据量 向量 转换 应用 | ||
本发明公开了一种通过日志轨迹对不同采集特征进行关系分析的方法,该方法包括的步骤有:分析不同采集设备的日志;将采集设备按照geohash或人工方式进行归类,生成归类编号,将采集到的特征分为键和值,利用向量相似度分析的方式,将采集到的特征视为键和值对,形成采集日志轨迹,分析一段时间内(例如在一天内)不同采集日志的轨迹相似度,并将相似度达到阈值的采集特征放在一起,采用top‑N算法获取某个采集特征对应的相似度最高的采集特征列表,应用于业务逻辑。本发明的有益技术效果是:将日志数据看成轨迹并转换成向量来分析,可以有效地减少对数据量的依赖,可以更快地让数据关联起来。
技术领域
本发明涉及一种关系分析的方法,尤其涉及一种通过日志轨迹对不同采集特征进行关系分析的方法。
背景技术
随着IT技术的发展,很多组织或公司有多个IT应用项目,这些IT项目由于互相并不打通数据,采集到的数据缺少关联性;有些IT项目就算是同一个项目内,由于采集数据的设备来源于不同厂商,也难以发现数据的相关性。现有技术中尚没有对应的解决方案,已经不能满足人们的要求。
发明内容
本发明的目的在于提供一种通过日志轨迹对不同采集特征进行关系分析的方法,利用归类编号和日志时间轨迹的方式来组织分析数据,将不同采集数据特征的关系分析出来,解决现有技术存在的缺憾。
本发明采用如下技术方案实现:
一种通过日志轨迹对不同采集特征进行关系分析的方法,其特征在于,该方法包括的步骤有:
分析不同采集设备的日志,将采集设备按照地理经纬度信息或人工方式进行归类,生成归类编号;
将采集到的特征视为键key,将所述键在不同采集设备中出现的位置信息(归类编号)和时间信息视为值value(采集日志的轨迹);
利用向量相似度分析的方式(用最小汉明距离来分析相似度,由于上一步采集设备按坐标先用geohash算法做了归类,所以这一步只需要按归类编号按大小顺序,可不用在向量中加入经纬度信息。实际工程中,如果采集设备坐标有较大偏差并难以找到原施工团队修改时,也可将坐标信息也编入向量,此时可换用余弦相似度来分析向量有较好效果),分析一段时间内(例如在一天内)不同采集日志的轨迹相似度,并将相似度达到阈值的采集特征放在一起;
将上一步预处理后的分析结果用图数据库保存,方法是用节点保存采集特征,存放采集特征之间轨迹相似的次数;
采用top-N算法获取某个采集特征对应的相似度最高的采集特征列表,应用于业务逻辑,在业务逻辑上通常是同一人的不同采集特征或一组互相认识的人。
进一步的,同一采集设备具有相同的归类编号。
进一步的,采用top-N算法获取某个采集特征对应的相似度最高的采集特征列表,应用于业务逻辑,该业务逻辑为同一人的不同采集特征或一组互相认识的人。
进一步的,对键值对采用最小汉明距离方法或余弦相似度进行向量相似度的分析。
进一步的,将采集设备按照geohash进行归类,生成归类编号。
本发明的有益技术效果是:将日志数据看成轨迹并转换成向量来分析,可以有效地减少对数据量的依赖,而且新的方法对采集设备的距离、采集设备的时间有一定容错性,可以更快地让数据关联起来。
附图说明
图1是实施例的某个公共场所的采集设备部署示意图。
图2是通过日志轨迹对不同采集特征进行关系分析的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海网博信息科技股份有限公司,未经珠海网博信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910322241.0/2.html,转载请声明来源钻瓜专利网。