[发明专利]面向多元数据的自动关联方法有效
申请号: | 201410838117.7 | 申请日: | 2014-12-29 |
公开(公告)号: | CN104516975B | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 付琨;许光銮;孙显;黄宇;王磊;田璟;宋俊 | 申请(专利权)人: | 中国科学院电子学研究所 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了面向多元数据的自动关联方法,选择多元数据,提取每个数据的时间属性,对时间属性不全的根据上下文自动补全,提取每个数据的地理中心位置和覆盖范围,并转换到统一的椭球坐标系下;对数据添加属性标签;根据数据的来源、类别、等级、分辨率属性对数据自动添加属性标签,具有相同标签的数据存在着隐含的关联关系;利用多属性信息挖掘数据间的关联关系;同时考虑数据的时间属性、位置属性和标签信息,利用改进的距离依赖中餐馆过程挖掘数据间的关联关系;保存数据之间的关联关系,作为已知信息用于后续自动关联组织。本发明的有益效果是充分考虑了多种属性信息进行数据关联,使得大量信息得到有效利用。 | ||
搜索关键词: | 关联关系 多元数据 时间属性 自动关联 属性标签 属性信息 地理中心位置 椭球坐标系 保存数据 标签信息 距离依赖 数据关联 数据添加 位置属性 已知信息 自动添加 挖掘 分辨率 隐含 标签 转换 覆盖 改进 统一 | ||
【主权项】:
1.面向多元数据的自动关联方法,其特征在于按照以下步骤进行:步骤1、选择多元数据,指不同类型但具有一定共性的数据,包括,影像数据和情报数据;步骤2、提取每个数据的时间属性,对时间属性不全的根据上下文补全;步骤3、提取每个数据的地理中心位置和覆盖范围,并转换到统一的椭球坐标系下;步骤4、对数据添加属性标签;根据数据的来源、类别、等级、分辨率属性对数据自动添加属性标签,具有相同属性标签的数据存在着隐含的关联关系,所述属性标签包括语义标签;步骤5:利用多属性信息挖掘数据间的关联关系;同时考虑数据的时间属性、位置属性和属性标签的信息,利用改进的距离依赖中餐馆过程挖掘数据间的关联关系;步骤6:保存数据之间的关联关系,作为已知信息用于后续自动关联组织;其中,所述步骤4中利用图像解译算法对数据自动添加所述语义标签,对每一幅图像进行识别,检测是否有舰船,以及检测舰船的型号,然后将这个舰船的名字作为语义标签添加到这个图像的标签中去;所述步骤5中利用改进的距离依赖中餐馆过程挖掘数据间的关联关系过程分为以下几步:5.1计算数据之间的时间距离,dijt表示数据时间属性上的距离,根据数据类型使用不同的时间粒度,普通数据采用天作为基本单位,时效性较高的数据采用秒为基本单位;5.2计算数据之间的地理位置距离,dijl表示数据位置属性上的距离,统一使用米为单位;5.3对所有数据随机初始化数据分组,每个数据都根据改进的距离依赖中餐馆的先验随机选取一个数据作为自己的邻居;改进的距离依赖中餐馆过程挖掘数据间的关联关系是在中餐馆过程的基础上考虑数据之间的依赖关系采用如下公式:f1,f2分别表示时间和位置距离的衰减函数,选取以下函数:f(d)=e‑d/a,f(d)=exp(‑d+a)/(1+exp(‑d+a)),f(d)=1[d<a],保证时间相近位置相邻的数据有更大的概率聚为一类;5.4循环采样数据之间的关联关系,其中以时间和地理距离作为先验,以属性标签的信息作为后验来计算采样的概率,并根据这个概率采样每个数据所选择的邻居数据;5.5选取收敛后若干轮的均值作为最终的结果;5.6根据采样结果恢复每个数据所选择的邻居数据,据此把数据聚类成不同的分组,自动建立数据之间的关联关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院电子学研究所,未经中国科学院电子学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410838117.7/,转载请声明来源钻瓜专利网。