[发明专利]一种用于在有限空间显示大规模多属性堆叠柱状图的方法有效
申请号: | 201810950082.4 | 申请日: | 2018-08-20 |
公开(公告)号: | CN109271440B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 巫英才;翁荻;陈然;邓紫坤 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/26 | 分类号: | G06F16/26 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 徐敏 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 有限 空间 显示 大规模 属性 堆叠 柱状图 方法 | ||
1.一种用于在有限空间显示大规模多属性堆叠柱状图的方法,其特征在于,包括以下步骤:
(1)获取数据并对其进行初始化;
(2)根据步骤(1)得到的初始化过的数据,进行平均采样并使用基于交换的启发式贪心方法,最小化由平均采样导致的多选项数值属性的信息损失,包括:
2-1、根据步骤(1)得到的初始化过的数据,对其进行平均采样,设置p为平均采样中的样本数量,选择p使得样本数量不会超过给定的阈值;
2-2、计算每个采样样本的各属性值,令表示对连续p个选项平均采样后获得的第i个样本的第j个平均后的标准化加权属性值;
2-3、平均采样会丧失大量的数据统计特征,信息损失为
2-4、采用基于交换的启发式贪心方法降低采样的信息损失,通过枚举交换策略,逼近信息损失最小的采样顺序,包括:
2-4-1、迭代所有的样本间的成对的数据项,并按2-3的计算方法计算当前的信息损失loss值为oldLoss,交换这对数据项的位置,重新计算当前的信息损失loss值为newLoss;
2-4-2、如果oldLoss值小于newLoss值,则将这对数据项位置进行交换;
否则,保持这对数据项的位置,迭代至无选项可交换位置则方法结束,获得最小化信息损失后的采样数据;
(3)根据步骤(2)得到的最小化信息损失后的采样数据,使用基于交换的启发式贪心方法,最小化采样后堆叠柱状图中多选项数值属性的抖动,包括:
3-1、根据步骤(2)得到的最小化信息损失后的采样数据,采用求导的方式计算数据抖动;
具体的,令表示第i个样本的前k个平均后的选项标准化加权属性值之和,采用基于一阶导数的度量以计算采样后选项属性值的抖动其中,导数G′ij由相邻样本对应属性值的差得到:G′i,j=(Gi+1,j-Gi-1,j)/2;
3-2、采用基于交换的启发式贪心方法枚举样本的交换策略,逼近数据抖动最小的显示顺序;
具体的,方法迭代所有的两两样本,并按3-1的计算方法计算当前的抖动wwiggles值为oldWwiggles,交换这对数据项的位置,重新计算当前的抖动wwiggles值为newWwiggles,如果oldWwiggles值小于newWwiggles值,则将这对数据项位置进行交换;否则,保持这对数据项的位置;迭代至无选项可交换位置则方法结束;获得增强可读性后的采样数据,可用其绘制堆叠柱状图;
(4)根据步骤(3)得到的增强可读性后的采样数据,绘制堆叠柱状图。
2.如权利要求1所述的用于在有限空间显示大规模多属性堆叠柱状图的方法,其特征在于,步骤(1)中,获取数据并对其进行初始化包括进行属性的标准化和加权计算。
3.如权利要求2所述的用于在有限空间显示大规模多属性堆叠柱状图的方法,其特征在于,进行属性的标准化和加权计算的具体步骤如下:
1-1、在数据集中,令数据选项的数量为n,数据指标的数量为m,每项数据包含多个维度的属性:c1、c2、…、cm,将每项数据的属性统一标准化到[0,1]区间;
比较属性值,获取cj_max为第j个指标属性的最大值,设c′ij为第i个数据项的第j个指标属性值,则第i个选项第j个标准化指标属性值为
1-2、将标准化后的数据进行加权,令wj表示第j个指标所占的权重,其中∑wj=1;
令fij=wjcij,表示第i个选项的第j个标准化指标加权数值属性值,其中0≤fij≤1,0≤cij≤1,则第i个数据项的总分数为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810950082.4/1.html,转载请声明来源钻瓜专利网。