[发明专利]一种多维数据集的洞察方法以及装置有效
申请号: | 202111192547.2 | 申请日: | 2021-10-13 |
公开(公告)号: | CN113987010B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 程鑫;张亚东;苗寒;邹常林;张探探;周成 | 申请(专利权)人: | 北京元年科技股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06Q10/06 |
代理公司: | 北京汇知杰知识产权代理有限公司 11587 | 代理人: | 李洁;董江虹 |
地址: | 100191 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多维 数据 洞察 方法 以及 装置 | ||
本发明提供了一种多维数据集的洞察方法以及装置,该方法包括:根据接收到的用户的数据洞察请求获取到目标多维数据集;针对目标多维数据集进行数据切片处理,生成多个数据切片;根据数据切片确定数据切片的洞察对象,其中,洞察对象包括数据切片的筛选维度、展开维度、期间、指标以及指标的聚合方式;将洞察对象进行数据模式检验,生成数据洞察结果。解决了针对于比较大型的多维数据集,现有技术挖掘出的数据不够深入、价值较低的技术问题。
技术领域
本发明涉及数据挖掘领域,尤其是涉及多维数据集的洞察方法以及装置。
背景技术
数据挖掘主要是面向决策,从海量数据中挖掘不为人知、无法直观得出的结论,例如内容推荐、相关度计算等。数据挖掘的工作更注重数据内在联系,数据仓库组建,分析系统开发,挖掘算法设计,往往需要研发人员从ETL开始处理原始数据,因此数据挖掘对研发人员的计算机水平有较高要求。
在现有技术下,在多维数据集中进行数据分析,往往是由专业的数据分析人员在OLAP系统上来完成的。OLAP是一个建立数据系统的方法,核心思想就是建立多维度的数据立方体,以维度(Dimension)和度量(Measure)为基本概念,辅以元数据,实现可以钻取、切片、切块、旋转等灵活、系统、直观的数据展现。
需要说明的是,针对于比较大型的多维数据集,现有技术挖掘出的数据不够深入、价值较低。
发明内容
本发明提供了一种多维数据集的洞察方法以及装置,以解决针对于比较大型的多维数据集,现有技术挖掘出的数据的价值较低的技术问题。
根据本发明的第一方面,提供了一种多维数据集的洞察方法,该方法包括:根据接收到的用户的数据洞察请求获取到目标多维数据集;针对目标多维数据集进行数据切片处理,生成多个数据切片;根据数据切片确定数据切片的洞察对象,其中,洞察对象包括数据切片的筛选维度、展开维度、期间、指标以及指标的聚合方式;将洞察对象进行数据模式检验,生成数据洞察结果。
进一步地,将洞察对象进行如下一个或多个的数据模式检验:首位贡献度检验、占比检验、两指标相关性检验、全局离群点检验、趋势检验、周期检验、转折点检验、时序异常检验。
进一步地,数据模式检验的结果为真或者假,其中,将洞察对象进行数据模式检验,生成数据洞察结果的步骤包括:将数据模式检验的结果为真的洞察对象确定为目标洞察对象;根据目标洞察对象生成数据洞察结果。
进一步地,在将洞察对象进行数据模式检验,生成数据洞察结果之后,方法包括:将多个数据洞察结果按照数据范围进行排序;控制将排序后的多个数据洞察结果进行可视化展示。
根据本发明的第二方面,提供了一种多维数据集的洞察装置,装置包括:获取单元,用于根据接收到的用户的数据洞察请求获取到目标多维数据集;成单元,用于针对目标多维数据集进行数据切片处理,生成多个数据切片;确定单元,用于根据数据切片确定数据切片的洞察对象,其中,洞察对象包括数据切片的筛选维度、展开维度、期间、指标以及指标的聚合方式;检验单元,用于将洞察对象进行数据模式检验,生成数据洞察结果。
进一步地,将洞察对象进行如下一个或多个的数据模式检验:首位贡献度检验、占比检验、两指标相关性检验、全局离群点检验、趋势检验、周期检验、转折点检验、时序异常检验。
进一步地,数据模式检验的结果为真或者假,其中,生成单元包括:确定模块,用于将数据模式检验的结果为真的洞察对象确定为目标洞察对象;生成模块,用于根据目标洞察对象生成数据洞察结果。
进一步地,装置还包括:排序单元,用于将多个数据洞察结果按照数据范围进行排序;展示单元,用于控制将排序后的多个数据洞察结果进行可视化展示。
根据本发明的第三方面,提供了一种计算机设备,包括存储器和处理器,存储器上存储有计算机指令,计算机指令在由处理器执行时导致上述任一项的方法被执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京元年科技股份有限公司,未经北京元年科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111192547.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种泡沫金属腔体成型材料及其成型方法
- 下一篇:一种花卉保鲜用保鲜结构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置