[发明专利]选择具有快照关系的网络表格的方法及装置在审
申请号: | 201410441120.5 | 申请日: | 2014-09-01 |
公开(公告)号: | CN104199924A | 公开(公告)日: | 2014-12-10 |
发明(设计)人: | 王宁;任红伟 | 申请(专利权)人: | 北京交通大学长三角研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 毛燕生 |
地址: | 212009 江苏省镇江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种选择具有快照关系的网络表格的方法及装置,该方法包括:将网络表格的集合按照网络表格的实体列的内容的领域进行分类,其中,实体列为能够标识网络表格的记录的属性列;在分类后的网络表格集合中,根据预设规则,选择与第一表格对应的多个第二表格,其中,多个第二表格是与第一表格具有快照关系的网络表格。通过本发明,选择与第一表格具有快照关系的多个第二表格,第二表格可用于优化查询以提高查询的效率,也可以用于大数据环境,使得系统能够实时地返回部分查询结果。 | ||
搜索关键词: | 选择 具有 快照 关系 网络 表格 方法 装置 | ||
【主权项】:
1.一种选择具有快照关系的网络表格的方法,网络表格间的快照关系,处理的数据是以表格为单位,其特征在于,包括:将网络表格的集合按照所述网络表格的实体列的内容的领域进行分类,其中,所述实体列为能够标识所述网络表格的记录的属性列;在所述分类后的所述网络表格集合中,根据预设规则,选择与第一表格对应的多个第二表格,其中,所述多个第二表格是与所述第一表格具有快照关系的网络表格;在所述分类后的所述网络表格集合中,根据预设规则,选择与第一表格对应的多个第二表格包括:分别确定所述网络表格集合中的每个表格在实体因素方面的如下参数:实体的覆盖率Ebase|σ (T1 ,T2 )、调节因素Eadjustment (T1 ,T2 )和实体的新鲜度Fru (T2 );分别确定所述每个表格的实体因素 S E n t i t y ( T 1 , T 2 ) = Fr u ( T 2 ) * exp ( - ( E b a s e | σ ( T 1 , T 2 ) - E a d j u s t m e n t ( T 1 , T 2 ) + μ ) 2 2 ) ; ]]> 分别确定所述第一表格和每个表格的属性重合度Sattr (T1 ,T2 );分别确定SEntity (T1 ,T2 )和Sattr (T1 ,T2 )的运算的结果;根据所述结果,选择满足第一预设条件的预设数目个表格作为所述第二表格;其中,T1 表示第一表格,T2 表示第二表格;通过如下方式确定 通过如下方式确定 通过如下方式确定 Fr u ( T 2 ) = F r ( T 2 ) max T k ∈ Γ ′ F r ( T k ) ; ]]> 其中ei 为第一表格T1 上满足选择条件σ的实体,count(ei )为在初筛选阶段处理的表集Γ'中,ei 在每个表中出现次数的和, 的取值为0或1;若T2 表中有ei ,则 表示T1 表中满足条件σ的实体集合,网络表之间的快照关系为:假设给定某种匹配条件,网络表T1 中匹配该条件的元组存在于网络表T2 中,T2 就被称为T1 匹配该条件的快照;其中μ为参数,用来控制函数在Ebase 和Eadjustment 两个指标下取得最大值的情况:若Eadjustment ≠0,则当μ=ε,ε为实数,实验控制取值,默认为0时,SEntity (T1 ,T2 )取最大值;若Eadjustment =0,则当μ=-1时,SEntity (T1 ,T2 )取最大值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学长三角研究院,未经北京交通大学长三角研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410441120.5/,转载请声明来源钻瓜专利网。