[发明专利]异构多源数据关联分析系统和方法有效
申请号: | 202111330974.2 | 申请日: | 2021-11-11 |
公开(公告)号: | CN113987131B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 张业红;顾行发;刘向东;黄祥志;石宇航;陈佳玮;朱玉婷 | 申请(专利权)人: | 江苏天汇空间信息研究院有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F16/23;G06F40/30 |
代理公司: | 北京华际知识产权代理有限公司 11676 | 代理人: | 施欢权 |
地址: | 213000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异构多源 数据 关联 分析 系统 方法 | ||
1.异构多源数据关联分析方法,其特征在于,包括以下步骤:
步骤S100:对异构多源数据进行关键词的提取,关键词的提取包含上层关键词、下层关键词和本体关键词的提取,并将所述上层关键词、下层关键词和本体关键词进行整合成关键词集;
步骤S200:基于所述步骤S100中的关键词集,进行关系网络的构建,所述关系网络的构建包括空间关系网络、时间序列链和语义关系网络;
步骤S300:基于所述步骤S200的空间关系网络、时间序列链和语义关系网络进行综合相关度的评估并制定相关的动态更新策略;
步骤S400:基于所述步骤S300的动态更新策略对其中的异构多源数据进行语义映射和数据融合操作;
所述步骤S400具体过程如下:
步骤S410:将异构多源数据中的关键词集中的关键词作为节点,对关键词集进行语义分析,所述语义分析包括形近词的语义分析、形音词的语义分析和近义词的语义分析,将三种语义构成关联子图,将所述关联子图与关系网络中的关系节点实现映射;
步骤S420:基于关系网络查找连接两节点之间的最短距离,记关键词节点为O1、O2,假设关键词节点O1、O2、......On为节点O1和O2之间的最短路径,则节点之间的最短语义距离为:其中P(Oi)表示节点Oi引出的边具有相同的权重,用节点Oi的权重表示,即连接O1、O2最短路径上第i边的权值,对于权重的计算,利用公式:其中Pid(S)为节点O的直接孩子节点数目;
步骤S430:基于步骤S420中的最短语义距离,将两节点的最短语义距离中包含的所有节点进行融合构成新的语义网络关系;
步骤S500:对步骤S400中的异构多源数据或者随机抽取的数据进行清洗,所述随机抽取的数据是指随机抽取的异构多源数据。
2.根据权利要求1所述的异构多源数据关联分析方法,其特征在于:所述步骤S200的具体过程如下:
步骤S210:将关键词集中的上层关键词、下层关键词和本体关键词根据空间属性进行关系网络的构建,所述空间属性包括位置空间属性和几何空间属性,由位置空间属性构建的关系网络为第一空间关系网,由几何空间属性构建的关系网络为第二空间关系网;
步骤S220:将关键词集中的上层关键词、下层关键词和本体关键词根据时间序列进行关系网络的构建得到第三时间关系网;所述时间序列为时间发展的自然顺序;
步骤S230:将关键词集中的上层关键词、下层关键词和本体关键词根据语义关系中的逻辑关系进行关系网络的构建得到第四语义关系网。
3.根据权利要求2所述的异构多源数据关联分析方法,其特征在于:所述步骤S300的具体过程如下:
步骤S310:记关系网络中的第一空间关系网、第二空间关系网、第三时间关系网和第四语义关系网构成一个关系网络集合A,记第一空间关系网为集合a、第二空间关系网为集合b、第三时间关系网为集合c、第四语义关系网为集合d;
步骤S320:分别计算四个关系网之间的两两之间是否相关,得到相关度集合γ,记两者相关有交集时特征值为1,不相关无交集时特征值为0;则有γ={a∩b,a∩c,a∩d,b∩c,b∩d,c∩d,},当有γ={1,1,1,1,1,1}时,所述关系网络综合相关度为峰值相关;当有γ={1,0,0,0,0,0}且特征值为1时对应的集合为任意组合,有且只有一种,所述关系网络综合相关度为谷底相关;其余所有情况均为半腰相关;
步骤S330:基于所述步骤S320中的综合相关度制定动态更新策略,当综合相关度为峰值相关时,对异构多源数据的更新进行同步覆盖式更新,即从所述关键词集的更新到关系网络的更新;当综合相关度为谷底相关时,对异构多源数据的更新采取融合减值式更新,将相关的两种关系网络进行融合得到新的关系网络为第五维度关系网;当综合相关度为半腰相关时,对异构多源数据采取逐步式更新;彼此相关联的网络依次传递更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏天汇空间信息研究院有限公司,未经江苏天汇空间信息研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111330974.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置