[发明专利]基于Isomap算法布局的低维平行坐标图构建方法在审
申请号: | 202010279193.4 | 申请日: | 2020-04-10 |
公开(公告)号: | CN111488502A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 牛奉高;赵欣蕊 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F16/904 | 分类号: | G06F16/904 |
代理公司: | 太原申立德知识产权代理事务所(特殊普通合伙) 14115 | 代理人: | 程园园 |
地址: | 030006*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 isomap 算法 布局 平行 标图 构建 方法 | ||
本发明属于可视化技术领域,具体涉及基于Isomap算法布局的低维平行坐标图构建方法。本发明通过对数据进行各维度间相关性计算,并依此进行布局,然后针对布局结果进行维度子集的划分,最后将维度子集进行顺序排列并构建平行坐标图。发明基于等距特征映射方法,利用大量短距离来测量长距离,从而对各维度进行更好的布局,并以此来进行低维平行坐标图的构建。使得最终得到的可视化图像能减少由于距离投影失真而带来的误差,在尽量保留原始数据大量有效信息的情况下,有效利用显示空间,并呈现出一个方便提取及解读相关维度信息的结果。
技术领域
本发明属于可视化技术领域,具体涉及基于Isomap算法布局的低维平行坐标图构建方法。
背景技术
随着大数据时代的到来,人们产生的数据量不断增多,同时数据的更新速度也在不断加快。大数据时代所带来的,不仅仅是数据量的增大,同时数据本身也发生了不小的变化。与过去相比,在现代信息流下产生的海量数据中,很大一部分都是高维数据。而由于空间想象能力的限制,人们很难直接从这种数据中来获得信息。在这种现状下,如何对高维数据进行有效处理,如何从高维数据中获取有价值的信息,就成为了有待解决的问题。
现如今,数据可视化(Data Visualization)已经成了解决该问题的一个重要方法。数据可视化是可视化分支的一种,它是将数据信息转化为视觉形式的过程,是关于数据视觉表现形式的科学技术研究。数据可视化将难以进行空间想象的高维数据,转化为可供人们直接观测的图形,这种转变不仅能够让人快速理解数据的表面信息,同时也能够充分利用人们的洞察力,使之更加轻松的推演出海量数据表象之下所隐含的逻辑关系。正因如此,高维数据的可视化也已经成为了当前众多科学家的研究方向之一。
发明内容
针对上述问题本发明提供了基于Isomap算法布局的低维平行坐标图构建方法。
为了达到上述目的,本发明采用了下列技术方案:
基于Isomap算法布局的低维平行坐标图构建方法,包括以下步骤:
步骤S1,利用Isomap算法进行维度相关性计算及布局;
步骤S2,维度子集划分;
步骤S3,维度顺序排布并构造平行坐标图。
进一步,所述步骤1中利用Isomap算法进行维度相关性计算及布局,还包括以下步骤:
步骤S1.1数据的预处理;
步骤S1.2计算数值维度的各个维度对(di,dj)间的距离dist(di,dj),并生成距离矩阵L;
步骤S1.3将得到的距离矩阵输入MDS算法,得到维度点的二维散点图布局。
再进一步,所述步骤S1.1数据的预处理的方法是数据清洗,填补缺失值,建立数据集,并将数据集维度的值视为向量;
数据集D有n个样本,样本的属性为m维,则数据集D和第i项ai表述为:
D={a1,a2,…,an}
ai={vi1,vi2,…,vim}
其中,vij表示第i项的第j维值;
将每个数值维度视为一个向量,则得到:
D={d1,d2,…,dm}
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010279193.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于表面贴装器件的快速夹具
- 下一篇:一种特种屏蔽电缆及其护套外形修整机