[发明专利]用于联机分析处理中关联关系的数据处理方法和装置有效
申请号: | 201410116940.7 | 申请日: | 2014-03-26 |
公开(公告)号: | CN103927337B | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 洪超 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 李志刚,吴贵明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 联机 分析 处理 关联 关系 数据处理 方法 装置 | ||
技术领域
本发明涉及计算机领域,具体而言,涉及一种用于联机分析处理中关联关系的数据处理方法和装置。
背景技术
在数据仓库中,通常采用星型关联模型和/或雪花型关联关系来进行事实表与维度表的建模。星型关联模型(星型模型)是指一张事实表对应多张单一的维度表,就像星星一样,而雪花型关联关系(雪花型模型)是指一张事实表对应多张维度表,有些维度表又可能指向多张其它的维度表,就像雪花一样。
在相关技术中,在联机分析处理的分析数据库中,一般基于事实表与维度表的原有关联关系进行数据查询。然而,根据上述查询方案,在处理雪花型关联关系中数据的查询时,会因为多了一步或者多步维度表到维度表的指向关系,而使得查询速度较慢。而处理星型关联模型中数据的查询时,虽然会因为只有一步指向关系而使得查询速度较快,但是采用星型关联模型在数据仓库中建模却要消耗大量的存储空间。
针对相关技术中在联机分析处理时,难以平衡查询速度和存储空间的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种用于联机分析处理中关联关系的数据处理方法和装置,以解决相关技术中在联机分析处理时,难以平衡查询速度和存储空间问题。
为了实现上述目的,根据本发明的一个方面,提供了一种用于联机分析处理中关联关系的数据处理方法。该方法包括:获取数据仓库中的第一关联模型,其中,第一关联模型包括事实表、维度表和事实表与维度表的第一关联关系,第一关联模型包括多个第一关联模型分支,每个第一关联模型分支包括事实表和维度表,并且多个第一关联模型分支具有相同的事实表,至少有一个第一关联模型分支为多维度分支,多维度分支包括一个事实表和多个维度表;从第一关联模型中获取多维度分支;在分析数据库中将第一关联模型中的多维度分支转换成第二关联模型分支,其中,第二关联模型分支中维度表的数目小于多维度分支中维度表的数目;以及根据第一关联模型分支和第二关联模型分支,在分析数据库中构建第二关联模型。
进一步地,在从第一关联模型中获取多维度分支之前,该数据处理方法还包括:判断第一关联模型中的第一关联模型分支是否为多维度分支,其中,如果判断出第一关联模型中的第一关联模型分支为多维度分支,则从第一关联模型中获取多维度分支包括:获取第一关联模型分支;将第一关联模型分支作为多维度分支。
进一步地,在分析数据库中构建第二关联模型之后,该数据处理方法还包括:判断第二关联模型中是否存在具有多个维度表的关联模型分支;如果判断出第二关联模型中存在具有多个维度表的关联模型分支,则将具有多个维度表的关联模型分支转换为多个具有一个维度表的关联模型分支;以及根据多个具有一个维度表的关联模型分支创建星型关联模型。
进一步地,在获取数据仓库中的第一关联模型之后,数据处理方法还包括:在数据仓库中创建第二关联模型的视图,其中,视图用于表示事实表与维度表之间的连表关系;将事实表指向视图,在分析数据库中将第一关联模型中的多维度分支转换成第二关联模型分支包括:查找第一关联模型中的多维度分支的事实表;根据事实表得到视图;基于视图在分析数据库中将第一关联模型中的多维度分支转换成第二关联模型分支。
进一步地,在数据仓库中创建视图之后,该数据处理方法还包括:根据连表关系创建连表关系的索引。
为了实现上述目的,根据本发明的另一方面,提供了一种用于联机分析处理中关联关系的数据处理装置。该装置包括:第一获取单元,用于获取数据仓库中的第一关联模型,其中,第一关联模型包括事实表、维度表和事实表与维度表的第一关联关系,第一关联模型包括多个第一关联模型分支,每个第一关联模型分支包括事实表和维度表,并且多个第一关联模型分支具有相同的事实表,至少有一个第一关联模型分支为多维度分支,多维度分支包括一个事实表和多个维度表;第二获取单元,用于从第一关联模型中获取多维度分支;第一转换单元,用于在分析数据库中将第一关联模型中的多维度分支转换成第二关联模型分支,其中,第二关联模型分支中维度表的数目小于多维度分支中维度表的数目;以及第一构建单元,用于根据第一关联模型分支和第二关联模型分支,在分析数据库中构建第二关联模型。
进一步地,该数据处理装置还包括:第一判断单元,用于在从第一关联模型中获取多维度分支之前,判断第一关联模型中的第一关联模型分支是否为多维度分支,其中,第二获取单元包括:获取模块,用于如果判断出第一关联模型中的第一关联模型分支为多维度分支,则获取第一关联模型分支;第一确定模块,用于将第一关联模型分支作为多维度分支。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410116940.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种二氮杂萘酮衍生物的制备方法
- 下一篇:一种别嘌醇杂质C的合成方法