[发明专利]数据分析方法及装置、电子设备、计算机可读存储介质在审
申请号: | 202010889880.8 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112000761A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 单桂华;田东;刘俊 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/26;G06F16/2458 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分析 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本发明公开了一种数据分析方法及装置、电子设备、计算机可读存储介质。其中,该方法包括:获取多个样本数据,其中,每个样本数据至少包括:数据地理信息、数据属性和数据值;基于数据地理信息,分析每个样本数据所属的数据分区;基于数据属性和数据值,分析样本数据之间的关联关系;展示每个样本数据所属的数据分区以及样本数据之间的关联关系。本发明解决了相关技术中在分析数据时,分析维度较为单一,无法有效查看数据之间的关联关系的技术问题。
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种数据分析方法及装置、电子设备、计算机可读存储介质。
背景技术
相关技术中,当前的各种数据类型所包含的数据之间关联错综复杂,尤其是数据的属性维度较多时,无法进行有效分析,例如,对于金融数据,当前在分析金融数据时,往往是局限于金融地域区分和单一维度分析,无法有效查看数据之间的关联关系;同时由于能够分析的数据量较少,且分析结果往往与整体/全国的金融数据有较大差异,分析结果往往过于片面化。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据分析方法及装置、电子设备、计算机可读存储介质,以至少解决相关技术中在分析数据时,分析维度较为单一,无法有效查看数据之间的关联关系的技术问题。
根据本发明实施例的一个方面,提供了一种数据分析方法,包括:获取多个样本数据,其中,每个所述样本数据至少包括:数据地理信息、数据属性和数据值;基于所述数据地理信息,分析每个样本数据所属的数据分区;基于所述数据属性和数据值,分析样本数据之间的关联关系;展示每个样本数据所属的数据分区以及样本数据之间的关联关系。
可选地,基于所述数据地理信息,分析每个样本数据所属的数据分区的步骤,包括:基于所述数据地理信息,对所述样本数据进行地域编码,得到与每个样本数据对应的地域标识;基于所述地域标识,分析每个样本数据的空间分布坐标;基于每个样本数据的空间分布坐标,确定每个样本数据所属的数据分区。
可选地,在展示每个样本数据所属的数据分区时,包括:统计每个数据分区中包括的样本数据的数目;确定展示地图的地图参数,其中,所述地图参数至少包括:虚拟高度和虚拟宽度;基于所述地图参数和每个数据分区的样本数据的数目,对每个所述数据分区内的样本数据进行线性压缩;在每个数据分区上展示线性压缩后的样本数据。
可选地,在获取多个样本数据之后,所述数据分析方法还包括:确定每个样本数据的数据属性的属性数量;在所述属性数量大于预设数量阈值时,确定每个数据属性的属性维度;基于每个所述数据属性的属性维度,对所述样本数据进行降维处理。
可选地,展示每个样本数据所属的数据分区以及所有数据之间的关联关系的步骤,包括:采用预设参数调节算法得到所有样本数据的聚合分布特征;基于所述聚合分布特征,选取分布均匀且数据值为非固定值域的样本数据,得到样本数据集合;采用预设值域分类方式,展示多组样本数据集合中所有数据之间的关联关系。
可选地,在展示每个样本数据所属的数据分区以及所有数据之间的关联关系之后,所述数据分析方法还包括:接收坐标点选指令;基于所述坐标点选指令,对所有样本数据进行筛选,得到筛选结果;基于所述筛选结果,确定每个坐标轴下的预设数据显示图的类别比例;展示所述类别比例。
根据本发明实施例的另一方面,还提供了一种数据分析装置,包括:获取单元,用于获取多个样本数据,其中,每个所述样本数据至少包括:数据地理信息、数据属性和数据值;第一分析单元,用于基于所述数据地理信息,分析每个样本数据所属的数据分区;第二分析单元,用于基于所述数据属性和数据值,分析样本数据之间的关联关系;展示单元,用于展示每个样本数据所属的数据分区以及样本数据之间的关联关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010889880.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置