[发明专利]数据分层方法、介质、装置和计算设备在审

专利信息
申请号: 201710687021.9 申请日: 2017-08-11
公开(公告)号: CN107423447A 公开(公告)日: 2017-12-01
发明(设计)人: 李顺平;祖琳;文宇 申请(专利权)人: 网易乐得科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京律智知识产权代理有限公司11438 代理人: 阚梓瑄,王卫忠
地址: 100193 北京市海淀区西北旺*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 分层 方法 介质 装置 计算 设备
【说明书】:

技术领域

发明的实施方式涉及通信及计算机领域,更具体地,本发明的实施方式涉及数据分层方法、介质、装置和计算设备。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

目前,在数据的统计分析中,会使用可视化图表的形式来直观地呈现统计结果,比如通过地图型图表来呈现不同地域的数据情况。

当通过地图型图表来呈现不同地域的数据情况时,不同地域对应的数据量以不同的颜色来进行展示。其中的一种方案是使用连续型颜色展现数值高低,即根据数值范围定义最大值与最小值对应的颜色,将地域数据根据数值的大小映射为不同的颜色,具体如图1所示,以地图型图表的形式展现不同地域内的新增用户数,各个地域的颜色根据新增用户数的值来展现相应的颜色。另一种方案即为分段型颜色方案,即将数值区间划分为多段,每段使用一个颜色进行表达。

发明内容

但是,连续型颜色展现数值高低的方案受限于色相环的颜色种类(通常包括12种不同的颜色)与视觉风格,会出现颜色可选区间较小、数值区分不明显的问题。而分段型颜色方案虽然能够将数值区间与颜色映射得较为清晰,但是由于数据分布的不规律性,会导致不同指标数据的颜色同质化严重,而且也会出现因各色值对应数据区间不均衡而没有地域区分度的问题,其根本原因在于数据分层不准确。

为此,非常需要一种改进的数据分层方案,以将待分层的数据更加均衡合理地分配到不同的数据区间内,保证不同数据区间之间有较为明显的区分度,进而能够有效地展现不同数据区间的数据特征。

在本上下文中,本发明的实施方式期望提供一种数据分层方法、介质、装置和计算设备。

在本发明实施方式的第一方面中,提供了一种数据分层方法,包括:将待分层数据按照数值大小进行排序,得到排序后的数据;根据预定的分层个数和分层后得到的数据区间的方差之和最小的原则,对所述排序后的数据进行分层。

在本发明的一些实施方式中,基于前述方案,根据预定的分层个数和分层后得到的数据区间的方差之和最小的原则,对所述排序后的数据进行分层的步骤,包括:根据预定的分层个数,确定所述排序后的数据所有可能的分层结果;计算每个可能的分层结果中所有数据区间的方差之和;将方差之和最小的分层结果作为所述待分层数据的分层结果。

在本发明的一些实施方式中,基于前述方案,计算每个可能的分层结果中所有数据区间的方差之和的步骤,包括:计算每个可能的分层结果中各个数据区间的方差;对所述每个可能的分层结果中各个数据区间的方差进行求和,以得到所述每个可能的分层结果中所有数据区间的方差之和。

在本发明的一些实施方式中,基于前述方案,根据预定的分层个数和分层后得到的数据区间的方差之和最小的原则,对所述排序后的数据进行分层的步骤,包括:基于分层后得到的数据区间的方差之和最小的原则,将所述排序后的数据分为N层;在得到的N层数据的基础上,继续按照分层后的数据区间的方差之和最小的原则逐步进行分层,直到分层个数达到预定个数,其中N小于所述预定个数。

在本发明的一些实施方式中,基于前述方案,基于分层后得到的数据区间的方差之和最小的原则,将所述排序后的数据分为N层的步骤,包括:确定所述排序后的数据在分为N层时所有可能的分层结果;计算每个可能的分层结果中所有数据区间的方差之和;将方差之和最小的分层结果作为所述排序后的数据分为N层的结果。

在本发明的一些实施方式中,基于前述方案,在得到的N层数据的基础上,继续按照分层后的数据区间的方差之和最小的原则逐步进行分层的步骤,包括:按照分层后的数据区间的方差之和最小的原则,对所述N层数据中的至少一层数据逐步进行分层。

在本发明的一些实施方式中,基于前述方案,所述N的值为2。

在本发明的一些实施方式中,基于前述方案,还包括:获取所述待分层数据的分层结果;对所述分层结果中的数据区间的端点值进行优化处理。

在本发明的一些实施方式中,基于前述方案,还包括:基于可视化图表的方式展现所述待分层数据的分层结果。

在本发明的一些实施方式中,基于前述方案,所述待分层数据包括:基于指定因素统计的数据;其中,所述指定因素包括以下至少一个:地域、时间、年龄段。

在本发明实施方式的第二方面中,提供了一种介质,其上存储有程序,该程序被处理器执行时实现如上述实施方式中第一方面所述的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易乐得科技有限公司,未经网易乐得科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710687021.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top