[发明专利]一种内存云计算平台上的数据仓库安全OLAP方法有效
申请号: | 201610016726.3 | 申请日: | 2016-01-12 |
公开(公告)号: | CN105701200B | 公开(公告)日: | 2019-08-20 |
发明(设计)人: | 张延松;张宇;王珊 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/22;G06F16/2455;G06F21/62 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 徐宁;孙楠 |
地址: | 100872 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种内存云计算平台上的数据仓库安全OLAP方法,在OLAP计算模型上消除事实表语义信息,事实表只存储数值型数据而不存储数据描述信息;在OLAP计算模型上采用基于编码的计算方法,在企业内部私有数据平台上进行维表查询和编码,在事实表存储云平台上实现基于无语义编码上的多维计算,编码的OLAP查询结果返回企业内部私有数据平台后进行语义解析,返回真实的查询结果;云平台事实表存储通过增加安全维度对度量属性进行编码,改变原始度量属性存储方式,防止对事实表度量属性的非法访问。本发明能够支持企业数据仓库数据在云平台上的存储和计算,提高OLAP计算的性价比并保证企业数据安全,能够应用于企业内存OLAP云计算或其他OLAP计算应用中。 | ||
搜索关键词: | 一种 内存 计算 平台 数据仓库 安全 olap 方法 | ||
【主权项】:
1.一种内存云计算平台上的数据仓库安全OLAP方法,其特征在于包括以下步骤:1)划分云计算数据集:将整个OLAP数据集按维表和事实表划分为两个数据集,维表存储描述信息,集中存储于企业内部私有数据平台;事实表由维表外键属性和数值型度量属性组成,不包含语义和数据描述信息,存储于云计算平台,实现基于无语义编码上的多维云计算;多维云计算将表示敏感语义信息的维表存储在企业内部数据平台上,存储代价较低,事实数据通过字典压缩方法将带有语义信息的属性转换为无语义的数值型数据,存储于云计算平台,而代表语义的编码信息存储于企业内部数据平台上;2)生成维表编码向量:OLAP查询在执行时分解为维表上的操作和事实表上的操作两个执行阶段,企业内部私有数据平台维表上的操作为在各个维表上根据where子句的选择条件投影出维分组向量,维分组向量与维表等长,维分组向量中的编码位置记录维表中满足谓词条件记录对应的分组属性,不满足维表谓词条件的分组属性记录为NULL空值;然后对维分组向量进行编码,用不含语义的字典数组编码代替维表分组属性;当维表中包含多个分组属性时,将分组属性组统一编码;数据仓库的维表采用代理键,维分组向量与维表代理键是一一映射关系,事实表外键直接映射到维分组向量相应的位置上,替代传统的连接操作;各个维表生成的维分组向量构成事实表上的多维过滤器,而且维分组向量的分组编码构成一个多维数组,用于事实表上的分组聚集计算;3)事实表多维过滤,创建度量索引:企业内部私有数据平台上创建的维分组向量通过网络传输到云计算平台,将云计算平台事实表的外键值映射到维过滤向量对应的位置,完成多维过滤操作,并且根据维过滤向量中的维坐标确定事实表记录在分组数组中的多维坐标值,将满足多维过滤条件的事实表记录对应的分组多维坐标值记录在与事实表等长的度量索引向量中,指示度量属性列上需要进行聚集计算的记录位置及聚集结果在分组多维数组中的位置;事实表外键列参照维分组向量完成多维过滤操作后,根据度量索引按位置访问查询相关的度量属性列,完成聚集计算,并将聚集计算结果存储于对应的分组器多维数组中,完成分组聚集计算;4)查询结果解析:OLAP查询的分组聚集结果对应多维数组,不包含语义信息;将云计算平台上生成的分组器多维数组通过网络传输回企业内部私有数据平台,根据维分组向量创建阶段生成的维分组编码反向解析出分组多维数组各坐标对应的分组属性值,将分组器多维数组的各个单元维坐标转换为分组属性值,生成OLAP查询结果;所述步骤1)中,所述数值型度量属性的安全云存储采用以下策略中的一种或任意两种策略的组合:改变度量属性顺序存储策略、基于delta值映射的数据安全策略、基于哈希函数的delta映射数据安全策略和基于位压缩编码重组的数据安全策略,其中,所述基于哈希函数的delta映射数据安全策略:在事实表数据存储时增加一个delta列,宽度为n位,delta列中的数据为随机数,每个事实表记录的delta值各不相同;预设m个哈希函数,哈希函数将键值映射到delta值对应的一位;对事实表进行分组,每个分组对应一组哈希函数映射,每一个哈希函数映射到事实表记录delta列的一位,构成n位的deltakey,然后将deltakey扩展到与键值相同的位宽,然后键值与位宽执行异或计算,生成编码键值替代原始键值存储在云计算平台;所述步骤3)中,访问事实表度量属性时,根据事实表的数值型度量属性存储策略,对应采用以下一种或任意两种策略解析安全存储的度量属性值:改变度量属性顺序存储解析策略、基于delta值映射的数据安全解析策略、基于哈希函数的delta映射数据安全解析策略和基于位压缩编码重组的数据安全解析策略。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610016726.3/,转载请声明来源钻瓜专利网。