[发明专利]数据查询方法及装置在审
申请号: | 201810564903.0 | 申请日: | 2018-06-04 |
公开(公告)号: | CN108829795A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 谭彬;周葳 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;马敬 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询 维度 创建 目标维度 数据查询 遍历 预设 数据查询效率 | ||
本发明实施例提供了一种数据查询方法及装置,通过获取待查询维度组合;遍历已创建cube,从所述已创建cube中,查询与所述待查询维度组合相同的维度组合;所述已创建cube是按照查询频繁度从最高到低的顺序,选取预设数量个目标维度组合确定的。本实施例通过遍历查询按照查询频繁度从最高到低的顺序,选取预设数量个目标维度组合确定得到的已创建cube,减少了查询已创建cube的数量,因此减少查询维度组合对应的数据的时间,提高数据查询效率。
技术领域
本发明涉及数据检索技术领域,特别是涉及一种数据查询方法及装置。
背景技术
随着网络科技的发展,现在的日志报表越来越多。以宣传产品为例产生日志报表的过程如下:
商家在网络上设置广告,宣传产品。用户点击、播放及购买广告产品分别产生日志报表,每一个日志报表包含多个维度,每个维度对应一组数据。例如:维度a对应年龄值;维度b对应城市名称;维度c对应职业名称。商家要求开发人员增加广告播放量,开发人员利用商家的要求,从日志报表中查询与符合商家要求增加广告播放量的维度,获得所需查询的各个维度对应的数据,然后根据日志报表中所需查询的各个维度对应的数据,对广告进行调整,以满足增加广告播放量的商家要求。
现有技术利用开源分布式分析工具kylin给日志报表中的每一个维度组合分别创建各自维度组合的表,这个表就称为cube,这个过程称为创建cube。例如:日志报表中包含三个维度,分别是a、b及c,则维度组合为:a、b、c、ab、ac、bc及abc,那么需要创建7个cube。开发人员通过遍历查询已创建的各个cube,找到cube中各个维度对应的数据,实现数据查询。由于现有技术为每个维度组合创建cube,导致查询数据过程需要遍历查询所有创建的cube,耗费的时间过长,导致查询效率不高。
发明内容
本发明实施例的目的在于提供一种数据查询方法,通过遍历查询按照查询频繁度从最高到低的顺序,选取预设数量个目标维度组合确定得到的已创建cube,减少了查询cube的数量,提高查询效率。具体技术方案如下:
第一方面,本发明实施例提供了一种数据查询方法,包括:
获取待查询维度组合;
遍历已创建cube,从所述已创建cube中,查询与所述待查询维度组合相同的维度组合,获得查询结果;所述已创建cube是按照维度组合的查询频繁度从最高到低的顺序,选取预设数量个目标维度组合确定的,所述查询结果包括:与待查询维度组合相同的维度组合及与待查询维度组合相同的维度组合对应的数据。
可选的,通过如下步骤确定所述已创建cube:
按照各个维度组合的查询频繁度,将预定时间内所有维度组合进行排序,得到排序后的维度组合;
从所述排序后的维度组合中,按照查询频繁度从最高到低的顺序的,选择前N个维度组合作为第一目标维度组合;
从所述排序后的维度组合中除所述第一目标维度组合以外的其余的维度组合中,按照查询频繁度从最高到低的顺序的,选择前M个维度组合;
将所述前M个的维度组合,分为K个局部簇;其中,N和M为正整数;N与M的和小于所有维度组合的个数;
针对每一个局部簇,将该局部簇中的各个维度组合进行合并,将合并后的各个局部簇的维度组合作为第二目标维度组合;
为所述第一目标维度组合创建第一cube;
为所述第二目标维度组合创建第二cube;
将所述第一cube和所述第二cube,确定为已创建cube。
可选的,所述将所述前M个的维度组合,分为K个局部簇包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810564903.0/2.html,转载请声明来源钻瓜专利网。