[发明专利]查询结果命中概率估计系统、方法、电子设备及介质有效
申请号: | 202210111026.8 | 申请日: | 2022-01-29 |
公开(公告)号: | CN114138798B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 朱鎔;曾恬静;普法德勒·安德烈亚斯·沃纳·罗伯特;陈唯;黄柏彤;丁博麟;周靖人 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/242;G06F16/2455 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 吕雁葭 |
地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询 结果 命中 概率 估计 系统 方法 电子设备 介质 | ||
1.一种查询结果命中概率估计系统,包括:
子表获取模块,被配置为获取第一表和第二表的连接表的多个第一子表,所述第一子表包含所述第一表的属性和所述第二表的属性,在所述多个第一子表的任一第一子表中,所述第一表的属性与所述第二表的属性之间的相关性小于第一预设阈值;
子查询条件获取模块,被配置为根据查询条件和所述第一表的属性获取第一子查询条件,根据所述查询条件和所述第二表的属性获取第二子查询条件;
命中概率获取模块,被配置为获取所述第一子查询条件在所述第一子表中的第一命中概率和所述第二子查询条件在所述第一子表中的第二命中概率,根据所述第一命中概率和所述第二命中概率,确定所述查询条件在所述第一表和第二表的连接表中的命中概率;
其中,所述多个第一子表通过以下方式获取:
将所述连接表作为所述第一子表,在所述第一子表中,获取所述第一表中任一属性与所述第二表中任一属性的相关性值;
将相关性值最高的属性对中的第一表的属性确定为指定属性,根据所述指定属性的属性值划分所述第一子表,使用划分结果更新所述第一子表;
重复所述获取相关性值、确定指定属性、划分第一子表和更新第一子表操作,直到所述第一子表中所述第一表的属性与所述第二表的属性之间的相关性值小于第一预设阈值;
所述根据所述第一命中概率和所述第二命中概率,确定所述查询条件在所述第一表和第二表的连接表中的命中概率,包括:对在所述多个第一子表的每一第一子表中获取的第一命中概率和第二命中概率的乘积求和,确定所述查询条件在所述第一表和第二表的连接表中的命中概率。
2.根据权利要求1所述的系统,其中,所述获取所述第一子查询条件在所述第一子表中的第一命中概率,包括:
获取所述第一子表与所述第一表的第一交集的第二子表,在所述第二子表中,所述第一表的属性与所述第一交集中的记录在所述第一子表中的第一出现次数的相关性小于第二预设阈值;
获取所述第一出现次数在所述第二子表中的期望值;
获取所述第一子查询条件在所述第二子表中的命中概率;
根据所述第一出现次数在所述第二子表中的期望值和所述第一子查询条件在所述第二子表中的命中概率,确定所述第一子查询条件在所述第一子表中的第一命中概率。
3.根据权利要求2所述的系统,其中,所述根据所述第一出现次数在所述第二子表中的期望值和所述第一子查询条件在所述第二子表中的命中概率,确定所述第一子查询条件在所述第一子表中的第一命中概率,包括:
针对所述第一交集中的每个第二子表,获取所述第一子查询条件在所述第二子表中的命中概率与所述第一出现次数在所述第二子表中的期望值的第一乘积;
根据所述第一交集中所有第二子表的第一乘积之和、所述第一交集中的记录数、所述第一子表的记录数,确定所述第一命中概率。
4.根据权利要求1所述的系统,其中,所述获取所述第二子查询条件在所述第一子表中的第二命中概率,包括:
获取所述第一子表与所述第二表的第二交集的第三子表,在所述第三子表中,所述第二表的属性与所述第二交集中的记录在所述第一子表中的第二出现次数的相关性小于第三预设阈值;
获取所述第二出现次数在所述第三子表中的期望值;
获取所述第二子查询条件在所述第三子表中的命中概率;
根据所述第二出现次数在所述第三子表中的期望值和所述第二子查询条件在所述第三子表中的命中概率,确定所述第二子查询条件在所述第一子表中的第二命中概率。
5.根据权利要求4所述的系统,其中,所述根据所述第二出现次数在所述第三子表中的期望值和所述第二子查询条件在所述第三子表中的命中概率,确定所述第二子查询条件在所述第一子表中的第二命中概率,包括:
针对所述第二交集中的每个第三子表,获取所述第二子查询条件在所述第三子表中的命中概率与所述第二出现次数在所述第三子表中的期望值的第二乘积;
根据所述第二交集中所有第三子表的第二乘积之和、所述第二交集中的记录数、所述第一子表的记录数,确定所述第二命中概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210111026.8/1.html,转载请声明来源钻瓜专利网。