[发明专利]一种基于关联矩阵的不确定数据连接合并算法在审
申请号: | 201710050489.7 | 申请日: | 2017-01-23 |
公开(公告)号: | CN106897385A | 公开(公告)日: | 2017-06-27 |
发明(设计)人: | 梁俊杰;王明锋 | 申请(专利权)人: | 武汉迎风聚智科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉河山金堂专利事务所(普通合伙)42212 | 代理人: | 胡清堂 |
地址: | 430077 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于关联矩阵的不确定数据连接合并算法,主要解决数据项含义不明确、数据对象不明确的不确定数据难以连接合并,从而无法得到数据描述对象的全息影像,造成数据难以理解和使用的问题。本发明通过研究数据表的属性重要度,以及数据表间属性的相似度,建立不确定数据表的关联矩阵,然后根据关联矩阵选择关联度大的数据表在关联属性上进行连接合并得到相似记录数据集,经过多轮连接合并操作直至将所有的原始不确定数据表进行充分连接合并,从而实现对不确定数据对象进行全面准确描述的目标。 | ||
搜索关键词: | 一种 基于 关联 矩阵 不确定 数据 连接 合并 算法 | ||
【主权项】:
一种基于关联矩阵的不确定数据连接合并算法,其特征在于:该方法包括以下步骤:步骤1:引入属性重要度,数据表中数据对象的某一属性的重要度越高则表示该属性对该类数据对象的区分度越大;计算数据表中各属性的重要度,找出数据表所有属性重要度的最大值;步骤2:确定数据表之间的关联度,并建立关联矩阵;步骤3:根据关联矩阵,按表关联度从大到小选取未连接的数据表在关联属性上连接合并,同时综合属性重要度、属性值相似度计算记录相似度合并关联记录进而合并关联表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉迎风聚智科技有限公司,未经武汉迎风聚智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710050489.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种要点题自动评价方法及装置
- 下一篇:一种大数据多维分析方法及系统