[发明专利]一种支持拓扑结构保持的高维数据可视化方法有效
申请号: | 201911179884.0 | 申请日: | 2019-11-27 |
公开(公告)号: | CN110955809B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 窦慧;申富饶;徐百乐 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/904 | 分类号: | G06F16/904;G06F16/901;G06F16/906;G06N3/048;G06N3/088 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 支持 拓扑 结构 保持 数据 可视化 方法 | ||
本发明提供了一种支持拓扑结构保持的高维数据可视化方法,基于自组织增量学习神经网络的高维数据可视化方法,以实现拓扑结构保持过程中自适应网络结构设定,并可实现可视空间数据密度分布情况展示。该方法主要包括:在线聚类,可视映射,可视渲染等几个部分。在线聚类从原始数据集中自组织的学习出一个可代表该结构的代表数据集;可视映射利用降维方法多维缩放,将数据集映射到可视空间内,并保持代表数据的相对距离;可视渲染展示数据集在可视空间分布情况。采用本发明进行高维数据可视化,可以实现自适应的可视网络结构生成,并在可视结果中展示数据相互关系的同时展示数据密度分布情况。
技术领域
本发明涉及高维数据可视化领域,尤其涉及一种支持拓扑结构保持的高维数据可视化方法。
背景技术
当今,计算机硬件技术的发展使得存储数据变得快捷简单。日常生活的各个领域的数据几乎都会被记录,例如购物网站消费记录、手机通信记录、微信聊天记录等等。这些被记录的信息,构成了的高维数据。这些高维数据就像一个可用信息储存池,发现高维数据中的潜在信息,提取其中有价值的信息,可以帮助人们更好的掌握规律、分析趋势。但是,从高维数据中获取有价值的隐藏信息并不是一件简单的事。单纯的使用计算机分析高维数据很难全面。为了更好的提取和分析高维数据,可以采用人机结合的方式处理高维数据。人类的灵活性、创造性和具有的常识,可以同机器的存储能力和计算能力相结合。但是由于人眼只能理解3维及以下维度的数据,所以对高维数据进行转换,使其能够被人直观的获取和处理变得非常重要,即高维数据可视化。
高维数据可视化的本质,是寻找一种最佳的映射关系,实现高维数据在低维空间的展现。在影射过程中,尽可能的减少信息的丢失。高维数据可视化的主要过程包括:
1、数据转换,对原始高维数据集进行处理,使其适用于后续步骤的要求。常见的数据转换手段包括采样、归一化、特征提取等。
2、可视映射,将处理过的高维数据集映射至可视空间,即一维、二维或三维空间。大量研究致力于这一步骤的实现和完善,包括使用常见的降维方法实现。
3、可视渲染,利用可视空间中的特征清晰明了的表达映射后的数据信息。通常使用位置、颜色、形状或大小等视觉特征进行渲染。
4、人机交互,根据当前的数据可视化结果,人为的调整可视化算法各步骤及其参数,实现更好的可视化效果。
在可视化中,算法应尽可能的保持高维数据的某些固有特性或特征。衡量高维数据可视化算法的最直接有效的标准,是衡量该算法是否有能力保持高维数据在某一方面的特性,例如拓扑保持能力、分类能力、维度间相关性保持能力等。
在可视化的过程中,可视映射是其中的核心步骤,许多降维方法被用于可视映射过程中。主成分分析法(PCA)和多维缩放(MDS)是经典的线性降维方法,在数据量较大的数据集中,这类方法计算强度过大,对计算机硬件要求较高。等度量映射(Isomap)、t分布邻域嵌入算法(t-SNE)是常用的非线性降维方法,但他们保持拓扑结构的能力较弱。自组织神经网络(SOM)是一种基于非监督学习的神经网络模型,可用在可视映射过程中,它可以通过将高维临近点映射到低维网格邻域来实现拓扑结构保持。但自组织神经网络中的低维网格结构必须被提前设计,不合理的网格结构对可视化结果存在很大的影响。无论多少高维数据点映射到该网格中,自组织神经网络中每个网格只会被标注一次,这导致很难在低维网格中观察到数据集的密度分布情况。
设计一种可视化方法可以在保持拓扑结构的同时,展示数据分布密度情况,是一个需要解决的问题。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种支持拓扑结构保持的高维数据可视化方法,为基于自组织增量学习神经网络的高维数据可视化方法,以实现拓扑结构保持过程中自适应网络结构设定,并可实现可视空间数据密度分布情况展示。本发明具体包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911179884.0/2.html,转载请声明来源钻瓜专利网。