[发明专利]一种高效的引用关系发现方法有效
申请号: | 201710409917.0 | 申请日: | 2017-06-02 |
公开(公告)号: | CN107145601B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 王琤;贾天宇 | 申请(专利权)人: | 北京数语科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了高效的引用关系发现方法,输入信息是基于文档的数据集,输出是发现数据集之间的关系,连接文档型数据库MongoDB并提取MongoDB的数据模型后浏览MonogDB中的所有数据集合,去除重复的数据,分析该数据集各属性间的依赖关系,找出超级键,超级键是一个属性集合,可以确定本文档中的每个属性,再根据数据集超级键之间的依赖关系,发现数据集之间的关系。本发明使用数据模型信息和数据类型分布来改进了Tane算法,使其更加高效,更适合文档型数据集,可以用于文档型数据集的规范化,数据清理等任务。 | ||
搜索关键词: | 一种 高效 引用 关系 发现 方法 | ||
【主权项】:
一种高效的引用关系发现算法,其特征在于:包括函数依赖发现算法,输入信息是基于文档的数据集, 输出是发现数据集之间的关系,连接文档型数据库MongoDB并提取MongoDB的数据模型后浏览MonogDB中的所有数据集合,去除重复的数据,分析该数据集各属性间的依赖关系,找出超级键,超级键是一个属性集合,可以确定本文档中的每个属性,再根据数据集超级键之间的依赖关系,发现数据集之间的关系;引用关系发掘算法,遍历每个集合中的每个超级键,后使用真值来检查每个其他的集合并测试其每个属性,只要一个文档的某个属性的某个可能取值不属于超级键的值集,系统将跳出循环,表示我们在这两个集合之间找不到引用关系,当这个属性的每个值都出现在超级键的值集中时,即找到一个潜在的引用关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数语科技有限公司,未经北京数语科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710409917.0/,转载请声明来源钻瓜专利网。
- 上一篇:在线式不间断电源设备
- 下一篇:导管固定夹