[发明专利]基于属性间依赖关系的网络表格的实体列的检测方法有效
申请号: | 201710002389.7 | 申请日: | 2017-01-03 |
公开(公告)号: | CN106844338B | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 王宁;张丽方 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/24 |
代理公司: | 11255 北京市商泰律师事务所 | 代理人: | 黄晓军 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于属性间依赖关系的网络表格的实体列的检测方法。针对一个网络表格,根据列值间的函数依赖关系计算任意两列间的近似函数依赖概率,根据所述近似函数依赖概率获取候选函数依赖集;根据网络表格的特点,删减候选函数依赖集中的噪声函数依赖得到近似函数依赖集;对近似函数依赖集进行3NF规范化,将3NF规范化后产生的主键集合作为网络表格的实体列。本发明提供的方法能更加准确地表达属性间内在的函数依赖关系;在计算近似函数依赖时基于一致性数据和不一致性数据对函数依赖的支持度,该算法具有明显的抗噪声能力,该方法不仅适用于单实体列的网络表格,还可用于多实体列的表格。 | ||
搜索关键词: | 基于 属性 依赖 关系 网络 表格 实体 检测 方法 | ||
【主权项】:
1.一种基于属性间依赖关系的网络表格的实体列检测方法,其特征在于,包括:/n针对一个网络表格,根据列值间的函数依赖关系计算任意两列间的近似函数依赖概率,根据所述近似函数依赖概率获取候选函数依赖集;/n根据网络表格的特点,删减候选函数依赖集中的噪声函数依赖得到近似函数依赖集;/n对近似函数依赖集进行3NF规范化,将3NF规范化后产生的主键集合作为网络表格的实体列;/n所述的针对一个网络表格,根据列值间的函数依赖关系计算任意两列间的近似函数依赖概率,根据所述近似函数依赖概率获取候选函数依赖集,包括:/n设X是网络表格T中的某个属性,A是T中不同于X的属性,当T中存在部分元组的(X,A)属性值对,使得X→A成立,则称X近似函数确定A或A近似函数依赖于X,记作
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710002389.7/,转载请声明来源钻瓜专利网。