[发明专利]一种强关系分析方法、系统和存储介质有效
申请号: | 202111472424.4 | 申请日: | 2021-12-06 |
公开(公告)号: | CN113901349B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 张广志;于笑博;成立立;杨占军 | 申请(专利权)人: | 北京融信数联科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/906 |
代理公司: | 北京沃杰永益知识产权代理事务所(普通合伙) 11905 | 代理人: | 杨杰 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关系 分析 方法 系统 存储 介质 | ||
本申请提供了一种强关系分析方法、系统和存储介质,针对特定的关系分析领域提取相关的特征信息,可以分析对象的具体关系种类,对于对象行为关联性分析更具有针对性;将特征信息按照时间、空间和行为特征分布,并对特征字段进行数据化,转换成一组坐标数据,可以将对象的行为信息隐藏,避免对象隐私泄露和篡改,满足隐私脱敏的多源异构平台数据相融合;通过分析行为特征曲线的相关性得到关系分析结果,可以将行为特点进行综合考虑,受人口行为多变性的干扰影响小,捕捉强关系社会网络的准确性更高。
技术领域
本申请属于数据分析技术领域,更具体的,涉及一种强关系分析方法、系统和存储介质。
背景技术
随着互联网信息技术发展,人们通过线上浏览和执行等动作留下大量的网络操作信息,对这些信息进行分析可以反映各个事件之间的关联性,从而判断人们的行为习惯和偏好,成为目前互联网聚类分析、侦查示踪、主动营销等实际需求的主要手段。
强关系通常是指行动者彼此之间存在高度互动关系,对事件之间进行强关系分析有助于快速掌握事件之间的关联逻辑。但是,受现代城市人口流动性大、人员行为多变以及磁吸效应影响因素复杂的影响,采用传统的分析方法捕捉强关系社会网络存在准确性偏差大、数据处理难度大的技术问题。
发明内容
有鉴于此,本申请提供了一种强关系分析方法、系统和存储介质,能够适应现代多样化的人口行为模式。
本申请的具体技术方案如下:
本申请第一方面提供一种强关系分析方法,包括如下步骤:
获取分析对象的行为数据,所述行为数据包括政务数据、消费数据以及浏览数据,提取流转于分析领域内的特征信息;
将特征信息按照属性进行分区排布,并对每一个分区下的特征字段进行数据化处理,生成坐标信息;
绘制关于特征字段的行为特征曲线,计算不同分析对象行为特征曲线的相关性;
根据相关性大小判断不同分析对象在所述分析领域中的关系强度。
优选地,提取流转于分析领域内的特征信息具体为:
根据行为数据中的字段属性和语义关联定义行为数据的分析领域,所述分析领域包括办公事项、生活事项和娱乐事项;
提取被定义为所属分析领域内的时间特征、空间特征和行为特征。
优选地,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
将时间字段顺延、间隔编排,根据停留长短确定间隔距离,生成时间坐标;
将空间字段以常驻地点为中心、散发编排,根据地理位置确定间隔距离,生成空间坐标。
优选地,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
提取行为字段的关键词,根据关键词引入不同的赋值运算符;
基于赋值运算符对空间坐标进行赋值,生成行为坐标。
优选地,绘制关于特征字段的行为特征曲线具体为:
以事件为单位、发生时间为顺序将坐标信息进行串联,所述行为特征曲线是关于时间、空间和行为的周期波动曲线。
优选地,计算不同分析对象行为特征曲线的相关性具体为:
以事件为单位对曲线分区,根据行为属性选择该分区内对应的计算模型,计算同一事件中两个曲线段的相关系数;
对各曲线段的相关系数进行权重分析得到相关性结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京融信数联科技有限公司,未经北京融信数联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111472424.4/2.html,转载请声明来源钻瓜专利网。