[发明专利]一种二维散点数据密度制图方法有效
申请号: | 201410430830.8 | 申请日: | 2014-08-28 |
公开(公告)号: | CN104200502B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 蒋锦刚;周斌;何贤强;徐曜;窦文洁 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06T11/00 | 分类号: | G06T11/00 |
代理公司: | 杭州求是专利事务所有限公司33200 | 代理人: | 杜军 |
地址: | 311121 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 二维 数据 密度 制图 方法 | ||
技术领域
本发明属于非参数统计制图领域,具体涉及一种二维散点数据密度制图方法。本发明中主要涉及到二维密度网格的优化布设,密度网格频数平面平滑方法,密度属性的色标与等值线表示,密度分布百分比统计与可视化等。本发明无需进行复杂的非参数密度统计计算,实施简单,且二维散点密度制图可视化效果良好,结果分析与展示直观多样。
背景技术
在散点数据密度制图中,首先需要进行数据的密度估计,而在数据的密度估计领域中,直方图密度估计(即由直方图表示概率)和核密度估计都是非参数密度估计的重要方法。其中,直方图技术一直处于非常重要的地位。随着样本量的增加,直方图同样也能很好地估计出总体分布特征。直方图是用矩形的宽度和高度来表示频数分布的图形[1]。最常见的直角坐标系制图展现方法中,以x轴表示所考察的数据变量,y轴表示频数,再以每一组的区间为底,该区间的频数为高作矩形,即可得到该样本数据的频数直方图。当然,直方图估计密度函数还是有不完美的地方:即:密度函数是不平滑的;密度函数受子区间宽度影响很大;当数据维数较少情况下,直方图的使用是很普遍的,但是在数据维数再增加时,这种方法就有局限性了。然而,和核密度估计相比,虽然直方图不能给出较为精确的样本密度估计,但其以简单、直观、易懂等优点在密度估计、数据分析等过程中为大众所接受。
核密度估计(kernel density estimation)是在概率论中用来估计未知的密度函数的另一种非参数检验方法之一。由Rosenblatt(1955)[2]和Emanuel Parzen(1962)[3]提出,用“核”来估计概率密度函数,当采用“平滑核”时,估计出的概率密度函数也是平滑的。当采用“非平滑核”时,估计出的概率密度函数也是不连续的。很多情况下都采用高斯核(Gaussin Kernel),这时称为高斯核密度估计,即用高斯核估计样本的概率密度函数。基于核密度估计的方法就没有直方图的局限性,但是其计算方法相对直方图技术却比较复杂。
在二维散点数据密度制图中,利用密度分布的空间梯度分布信息映射颜色索引进行密度制图最直观常用的制图方法。对二维散点数据所在的空间平面进行网格化,并统计网格中的散点数目是进行密度统计的一种快捷有效的途径。其中,网格大小的布设对网格中散点密度的统计结果影响重大,网格稀疏或过于密集,散点数据空间密度统计结果的分布信息难以完整展现,基于密度信息的制图结果自然难以表现。关于组距(网格大小)的选择,有许多方法并存在很大争议。组距在很大程度上影响密度制图结果的性质和总体分布特征,常用的组距经验计算方法包括Sturges(1926)公式[4]、Doane(1976)公式[5]、Scott(1979)公式[6]和Freedman and Diaconis(1981)公式[7]方法等。
利用密度分布的空间梯度分布信息映射颜色索引进行密度制图国内外已经有相关软件进行了实现,然而,其密度估计的方法和密度估计结果的优化和处理上都不尽相同,最为重要的是在目前出现的二维散点数据密度制图上,相关分布的数理特征定量信息却很难表现,密度分布百分比统计与可视化为解决上述相关问题,而进行的技术开发与设计。
引证文件
[1].张建方,王秀祥.直方图理论与最优直方图制作[J].应用概率统计,
2009,25(2):201-214.
[2].M Rosenblatt.Remarks on some nonparametric estimates of a density function.Annals of Mathematical Statistics.1956,27(6):832-837.
[3].E Parzen.On estimation of a probability density function and mode.Annals of Mathcmatical Statistics.1962,33(8):1065-1076.
[4].Sturges,H.A.The choice of a class interval,J.Amer.Statist.Assoc.,21(1926),65-66.
[5].Doane,D.P.Aesthetic frequency classi-cations,Amer.Statist.,30(1976),181-183.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410430830.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置