[发明专利]多维度数据分析模型动态扩展方法和系统有效
申请号: | 201510256270.3 | 申请日: | 2015-05-19 |
公开(公告)号: | CN104850623B | 公开(公告)日: | 2018-08-07 |
发明(设计)人: | 冯讯;韩晓南 | 申请(专利权)人: | 杭州迅涵科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州知通专利代理事务所(普通合伙) 33221 | 代理人: | 应圣义 |
地址: | 311800 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多维 度数 分析 模型 动态 扩展 方法 系统 | ||
本发明提供一种多维度数据分析模型动态扩展方法和系统,所述扩展方法包括导入数据集,检测数据集获得检测信息。根据检测信息将数据集内的属性字段映射到预先设定的维度模型或建立新的维度,形成动态扩展后的维度模型。根据动态扩展后的维度模型建立表征属性字段和属性字段所对应的元素之间关系的元素表和表征属性字段和所属维度模型内层级之间关系的关系表。本发明提供的多维度数据分析模型动态扩展方法和系统支持维度的动态扩展,扩展非常灵活,不同用户之间的扩展不会相互干扰,具有很低的扩展成本,且可以处理动态、多样的数据,符合大数据时代的需求。
技术领域
本发明设计数据分析领域,且特别涉及一种多维度数据分析模型动态扩展方法和系统。
背景技术
数据分析系统需要将其代表的业务场景表示成计算机能够处理的形式,这就是分析的数据模型。同时,用户也通过数据模型去理解数据,并与系统交互。
目前主要有两种方法来实现数据分析:一是为某个场景定制一个应用,这样可以比较贴切地描述分析对象,理论上可以达到理想的效果,但是开发资源要求高,受开发者水平限制大。
另一种方法是在一个分析系统中,建立能够描述不同数据模型的语言或工具。这种方法使数据分析系统能适用于不同业务场景,具有很大优势。在这种系统中,数值分析最有效的方法是利用维度的概念。但是现有的多维度分析系统建立模型的灵活度有限,一般来说,模型描述的是一个静态的数据集,而且都要求先建立完整的模型,才能开始分析。数据模型一旦建立,变动的代价将很大,当用户面对预定义维度以外的数据时,数据分析就不能有效进行。这样的多维度模型不适合多数据来源,或半结构化,非结构化数据的分析
发明内容
本发明为了克服现有分析系统开发成本高且扩展困难的问题,提供一种多维度数据分析模型动态扩展方法和系统。
为了实现上述目的,本发明提供一种多维度数据分析模型动态扩展方法包括:
导入数据集,检测数据集获得检测信息;
根据检测信息将数据集内的属性字段映射到预先设定的维度模型或建立新的维度,形成动态扩展后的维度模型;
根据动态扩展后的维度模型建立表征属性字段和属性字段所对应的元素之间关系的元素表和表征属性字段和所属维度模型内层级之间关系的关系表。
于本发明一实施例中,根据检测信息将数据内的属性字段映射到预先设定的维度模型的方法包括直接映射和间接映射。
于本发明一实施例中,当数据集内的某一属性字段与其所属的维度模型内某一层级之间满足设定规则时,属性字段直接映射到其所属的维度模型内,形成层级的子节点或父节点。
于本发明一实施例中,当数据集内的某一属性字段的元素与维度模型内某一层级的元素之间存在多对一或一对多的关系时,将属性字段动态增加到其所属的维度模型内,且属性字段为层级的父节点或子节点。
于本发明一实施例中,导入数据集后,采用抽样检测或全样本检测来获得检测信息。
于本发明一实施例中,检测信息包括:数据类型、数据内容和数据范围,数据类型由属性字段表征,数据内容由元素表征,数据范围为属性字段所对应的元素的一致程度。
于本发明一实施例中,根据检测信息将数据内的属性字段映射到预先设定的维度模型的步骤包括:
将数据范围与设定阈值进行比较;
当数据范围大于或等于设定阈值时,匹配数据类型和预先设定的维度模型;
当数据类型与预先设定的维度模型匹配时,将数据集内的属性字段映射到预先设定的维度模型;否则,建立新的维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州迅涵科技有限公司,未经杭州迅涵科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510256270.3/2.html,转载请声明来源钻瓜专利网。