[发明专利]数据分层方法、介质、装置和计算设备在审
申请号: | 201710687021.9 | 申请日: | 2017-08-11 |
公开(公告)号: | CN107423447A | 公开(公告)日: | 2017-12-01 |
发明(设计)人: | 李顺平;祖琳;文宇 | 申请(专利权)人: | 网易乐得科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律智知识产权代理有限公司11438 | 代理人: | 阚梓瑄,王卫忠 |
地址: | 100193 北京市海淀区西北旺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分层 方法 介质 装置 计算 设备 | ||
技术领域
本发明的实施方式涉及通信及计算机领域,更具体地,本发明的实施方式涉及数据分层方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前,在数据的统计分析中,会使用可视化图表的形式来直观地呈现统计结果,比如通过地图型图表来呈现不同地域的数据情况。
当通过地图型图表来呈现不同地域的数据情况时,不同地域对应的数据量以不同的颜色来进行展示。其中的一种方案是使用连续型颜色展现数值高低,即根据数值范围定义最大值与最小值对应的颜色,将地域数据根据数值的大小映射为不同的颜色,具体如图1所示,以地图型图表的形式展现不同地域内的新增用户数,各个地域的颜色根据新增用户数的值来展现相应的颜色。另一种方案即为分段型颜色方案,即将数值区间划分为多段,每段使用一个颜色进行表达。
发明内容
但是,连续型颜色展现数值高低的方案受限于色相环的颜色种类(通常包括12种不同的颜色)与视觉风格,会出现颜色可选区间较小、数值区分不明显的问题。而分段型颜色方案虽然能够将数值区间与颜色映射得较为清晰,但是由于数据分布的不规律性,会导致不同指标数据的颜色同质化严重,而且也会出现因各色值对应数据区间不均衡而没有地域区分度的问题,其根本原因在于数据分层不准确。
为此,非常需要一种改进的数据分层方案,以将待分层的数据更加均衡合理地分配到不同的数据区间内,保证不同数据区间之间有较为明显的区分度,进而能够有效地展现不同数据区间的数据特征。
在本上下文中,本发明的实施方式期望提供一种数据分层方法、介质、装置和计算设备。
在本发明实施方式的第一方面中,提供了一种数据分层方法,包括:将待分层数据按照数值大小进行排序,得到排序后的数据;根据预定的分层个数和分层后得到的数据区间的方差之和最小的原则,对所述排序后的数据进行分层。
在本发明的一些实施方式中,基于前述方案,根据预定的分层个数和分层后得到的数据区间的方差之和最小的原则,对所述排序后的数据进行分层的步骤,包括:根据预定的分层个数,确定所述排序后的数据所有可能的分层结果;计算每个可能的分层结果中所有数据区间的方差之和;将方差之和最小的分层结果作为所述待分层数据的分层结果。
在本发明的一些实施方式中,基于前述方案,计算每个可能的分层结果中所有数据区间的方差之和的步骤,包括:计算每个可能的分层结果中各个数据区间的方差;对所述每个可能的分层结果中各个数据区间的方差进行求和,以得到所述每个可能的分层结果中所有数据区间的方差之和。
在本发明的一些实施方式中,基于前述方案,根据预定的分层个数和分层后得到的数据区间的方差之和最小的原则,对所述排序后的数据进行分层的步骤,包括:基于分层后得到的数据区间的方差之和最小的原则,将所述排序后的数据分为N层;在得到的N层数据的基础上,继续按照分层后的数据区间的方差之和最小的原则逐步进行分层,直到分层个数达到预定个数,其中N小于所述预定个数。
在本发明的一些实施方式中,基于前述方案,基于分层后得到的数据区间的方差之和最小的原则,将所述排序后的数据分为N层的步骤,包括:确定所述排序后的数据在分为N层时所有可能的分层结果;计算每个可能的分层结果中所有数据区间的方差之和;将方差之和最小的分层结果作为所述排序后的数据分为N层的结果。
在本发明的一些实施方式中,基于前述方案,在得到的N层数据的基础上,继续按照分层后的数据区间的方差之和最小的原则逐步进行分层的步骤,包括:按照分层后的数据区间的方差之和最小的原则,对所述N层数据中的至少一层数据逐步进行分层。
在本发明的一些实施方式中,基于前述方案,所述N的值为2。
在本发明的一些实施方式中,基于前述方案,还包括:获取所述待分层数据的分层结果;对所述分层结果中的数据区间的端点值进行优化处理。
在本发明的一些实施方式中,基于前述方案,还包括:基于可视化图表的方式展现所述待分层数据的分层结果。
在本发明的一些实施方式中,基于前述方案,所述待分层数据包括:基于指定因素统计的数据;其中,所述指定因素包括以下至少一个:地域、时间、年龄段。
在本发明实施方式的第二方面中,提供了一种介质,其上存储有程序,该程序被处理器执行时实现如上述实施方式中第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易乐得科技有限公司,未经网易乐得科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710687021.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种中药材提取自控收集出渣装置
- 下一篇:一种新型移动交通岗亭
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置