[发明专利]创建数据库表的样本的方法、系统和计算机可读存储介质有效
申请号: | 201480046615.6 | 申请日: | 2014-06-26 |
公开(公告)号: | CN105493085B | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | T·L·韦德惠泽恩 | 申请(专利权)人: | 洛吉奇布洛克斯公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/22 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 刘凤香 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 用于查询大小估计的显著性采样包括识别出一数据库表中的两个或更多列,其在一个或多个其他表中具有相应的列。对所识别出的列中的每一列的域应用一个或多个散列函数。对第一列的域应用第一散列函数,并且对第二列的域应用第二散列函数。选择数据库表中的行的子集。所述选择包括选择数据库表中的其中第一散列函数的结果满足第一数值阈值的各行,以及选择数据库表中的其中第二散列函数的结果满足第二数值阈值的各行。创建对应于数据库表的样本数据库表。所述样本数据库表包括数据库表中的行的所选子集。 | ||
搜索关键词: | 用于 查询 大小 估计 显著 采样 | ||
【主权项】:
1.一种创建数据库表的样本的方法,所述方法包括:识别第一数据库表中的第一列和第二列,第一列和第二列均在一个或多个其他数据库表中具有相应的列;对第一列和第二列中的值应用一个或多个散列函数,所述应用包括对第一列的值应用第一散列函数,以及对第二列的值应用第二散列函数;在第一数据库表中选择其中第一散列函数的结果满足第一数值阈值或其中第二散列函数的结果满足第二数值阈值的行的子集;以及创建与第一数据库表和所述一个或多个其他数据库表的所述行的子集的连接操作的结果对应的样本数据库表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于洛吉奇布洛克斯公司,未经洛吉奇布洛克斯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480046615.6/,转载请声明来源钻瓜专利网。