[发明专利]一种基于BIDE的OLAP查询日志挖掘及推荐方法在审
申请号: | 201110226191.X | 申请日: | 2011-08-08 |
公开(公告)号: | CN102254034A | 公开(公告)日: | 2011-11-23 |
发明(设计)人: | 张鲁杭;陈岭;肖敏;殷婷;胡黎玮 | 申请(专利权)人: | 浙江鸿程计算机系统有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bide olap 查询 日志 挖掘 推荐 方法 | ||
技术领域
本发明涉及OLAP推荐技术,特别涉及一种基于BIDE的OLAP查询日志挖掘及推荐方法。
背景技术
联机分析处理(Online Analytical Processing,OLAP)支持分析人员和决策者从多个角度对数据进行快速、一致、交互地访问。在OLAP系统中,用户可以透过多维视图,使用上卷、下钻、旋转、切片、切块等操作,从多个角度自主地进行数据分析和知识发现,从而对数据更深入了解。但是,通过OLAP操作浏览多维数据的过程非常繁琐,用户往往无法确定下一步如何操作,不断尝试无效查询操作,降低了实现业务分析目标的效率。
为了提高用户面对海量信息的快速反应力,将推荐技术引入OLAP领域。然而传统的推荐技术不能直接用于OLAP领域,究其原因,主要在于传统推荐方法推荐的是一个结果,而OLAP推荐的是用户一个查询目标中的下一步分析操作。
发明内容
本发明为克服现有技术中存在的不足之处,目的在于提供一种基于BIDE的OLAP查询日志挖掘及推荐方法,该方法将可能的下一步查询推荐给OLAP用户,简化用户浏览分析多维数据的过程,解决了现有技术中存在的问题。
本发明是通过以下技术方案达到上述目的:一种基于BIDE的OLAP查询日志挖掘及推荐方法,包括以下步骤:
1)根据OLAP服务器日志文件中的历史查询语句划分查询会话:首先,判断本条查询语句是否是最顶层的查询语句,然后通过判断后一条查询语句是否是在前一条查询语句的基础上连续上卷若干层以内形成的,作为判断前后两条查询语句是否属于同一个查询会话的标志,若是,则将本条查询语句加入当前查询会话中,若否,将本条查询语句作为新查询会话的第一条查询语句,开始划分为一个新的查询会话,从而划分查询会话;
2)通过对查询会话中前后两条查询语句的比较,用不同的标志来记录OLAP的基本操作顺序,从而在查询会话中生成查询序列;
3)在生成的查询序列中运用BIDE算法,挖掘连续的查询模式,得到历史查询模式;
4)通过将每一个查询模式,及其它的所有子查询插入到树型结构中的办法,来建立查询后缀树,使得这棵查询后缀树包含了查询模式所有可能的子查询模式;
5)根据用户的当前查询序列,运用AQPM算法,在查询后缀树中寻找匹配当前查询序列的历史查询模式,预测用户的下一步查询;
6)按照概率大小对候选查询排序,选择前五个查询推荐给用户。
作为优选,步骤1所述的通过判断后一条查询语句是否是在前一条查询语句的基础上连续上卷若干层以内形成的,作为判断前后两条查询语句是否属于同一个查询会话的标志,所述的若干层为5层。
作为优选,步骤6)所述的按照概率大小对候选查询排序基于马尔科夫模型进行。
作为优选,历史查询模式和查询后缀树根据OLAP服务器日志文件的改变动态更新。
本发明的有益效果:该方法是一种新的用于OLAP中的推荐方法,与现有的推荐方法相比,其优点在于:
1)抓住OLAP领域查询操作的特点,提取日志文件中表示OLAP操作的字段,将日志文件抽象成查询序列,简化了日志文件的表示方法;
2)利用BIDE算法在查询序列中挖掘查询模式,在保证不降低推荐准确率的前提下,提高了后续推荐的效率;
3)通过在查询模式上建立后缀树,即把所有查询模式及其后缀模式索引到一颗共享前缀的树上,使得后续模式匹配无需采用搜索算法查找查询匹配的起点,提高了模式匹配的速度。
4)提出模糊查询模式匹配(Approximate Query Pattern Matching,AQPM)算法,用于在连续查询模式中寻找匹配当前查询序列的下一步查询,提高了推荐的准确度。
附图说明
图1是本发明的系统构架示意图;
图2是基于BIDE的OLAP查询日志挖掘及推荐方法流程图;
图3是AQPM算法流程图。
具体实施方式
实施例1:下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
本发明系统构架由数据准备部分和实时推荐两部分组成,总体的系统架构如图1所示:在该系统中,数据准备部分负责在OLAP历史查询日志中挖掘查询模式,实时推荐部分负责获取用户当前的查询序列,在查询模式中寻找匹配的模式,从而将下一步查询推荐给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鸿程计算机系统有限公司,未经浙江鸿程计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110226191.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:不动井口连续冲砂装置
- 下一篇:油井抽油杆减震器