[发明专利]数据关联性分析方法及系统、可读存储介质有效
申请号: | 201910592394.7 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110990777B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 侯占杰;周轶;季学伟;方理平;李燕;张艳艳;陈明;陈晓岚;刘耀峰;梅楠;张维;侯烺祎;贾娜莉;刘艳 | 申请(专利权)人: | 北京市应急管理科学技术研究院;北京天之华软件系统技术有限责任公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06Q50/00 |
代理公司: | 北京东方芊悦知识产权代理事务所(普通合伙) 11591 | 代理人: | 彭秀丽 |
地址: | 101100 北京市通州区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 关联性 分析 方法 系统 可读 存储 介质 | ||
本发明提供的数据关联性分析方法及系统、可读存储介质,根据待分析数据对象的字段点的特性选择对应的相关系数计算模型,计算在同一时间段内不同的字段点两两之间的相关系数,以得到两两强显性相关的字段点及待分析数据对象,构建社会网络关系矩阵,绘制出不同业务之间的强相关业务的社会网络结构图,计算及排名出选到的各业务各字段点在所述社会网络结构中的中心度和中心势;根据中心度对社会网络结构中的业务进行重要度排名;根据中心势确定社会网络结构中各业务的总体整合度。本发明提供的以上方案,将社会网络分析引入业务管理信息系统的众多数据资源的分析中,推动信息资源的精简及整合,明了不同平台或系统间业务数据的联动性。
技术领域
本发明涉及数据统计及分析应用技术领域,具体涉及一种数据关联性分析方法及系统和一种可读存储介质。
背景技术
政务资源信息系统及共享平台包含的业务子系统众多,其涉及到的业务字段更多,且不同的业务字段分散在各自不同子系统的不同数据表中。难以确定不同平台或不同系统中的数据之间是否有关联,而且分辨及快速掌握哪些数据是关键业务数据也较为困难。操作人员不能确定各业务系统数据在整体系统中的重要程度如何,为各业务系统信息整合、相互间信息交换与共享及信息资源合理布局等工作的有效进行增添了障碍或降低了效率。
发明内容
本发明实施例旨在提供一种数据分析方法和系统、一种可读存储介质,以解决现有技术中难以对多系统中的多种数据进行关联性判断,整合数据难度大和效率低的技术问题。
本发明提供一种数据关联性分析方法,包括如下步骤:
获取待分析数据对象,所述待分析数据对象来自于不同的业务且对应于同一时间段,每一所述待分析数据对象具有特定的字段点;
根据所述待分析数据对象的字段点的特性选择对应的相关系数计算模型,根据所述相关系数计算模型计算在所述时间段内不同的所述字段点两两之间的相关系数得到相关性计算结果;
根据所述相关性计算结果得到两两强显性相关的字段点,确定两两强显性相关的待分析数据对象,依据两两强显性相关的待分析数据对象构建社会网络关系矩阵,所述社会网络关系矩阵中各向量间的关系值为对应的相关系数绝对值;
根据所述社会网络关系矩阵绘制出不同业务之间的强相关业务的社会网络结构图,计算及排名出选到的各业务各字段点在所述社会网络结构中的中心度和中心势;
根据所述中心度对所述社会网络结构中的业务进行重要度排名;根据所述中心势确定所述社会网络结构中各业务的总体整合度。
可选地,上述的数据关联性分析方法中,根据所述待分析数据对象的字段点的特性选择对应的相关系数计算模型,根据所述相关系数计算模型计算在所述时间段内不同的所述字段点两两之间的相关系数得到相关性计算结果,在此步骤中,所述待分析数据对象的字段点的特性字段变量是连续型数据时选择对应的Pearson相关系数计算模型,所述Pearson相关系数计算模型为:
其中,σX和σY分别表示X,Y两个变量的标准差;Cov(X,Y)表示X,Y两个变量的协方差,且X,Y两个变量的标准差均不等于零。
可选地,上述的数据关联性分析方法中,根据所述待分析数据对象的字段点的特性选择对应的相关系数计算模型,根据所述相关系数计算模型计算在所述时间段内不同的所述字段点两两之间的相关系数得到相关性计算结果,在此步骤中,所述待分析数据对象的字段点的特性字段变量是分类有序型数据时选择对应的Spearman相关系数计算模型,所述Spearman相关系数计算模型为:
其中,m为等级个数;d为二列成对变量的等级差数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市应急管理科学技术研究院;北京天之华软件系统技术有限责任公司,未经北京市应急管理科学技术研究院;北京天之华软件系统技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910592394.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置