[发明专利]一种降维映射的大数据可视化方法在审
申请号: | 201510235026.9 | 申请日: | 2015-05-11 |
公开(公告)号: | CN104834716A | 公开(公告)日: | 2015-08-12 |
发明(设计)人: | 戴鸿君;于治楼 | 申请(专利权)人: | 浪潮集团有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜明 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 映射 数据 可视化 方法 | ||
技术领域
本发明涉及计算机的大数据处理领域,具体地说是一种降维映射的大数据可视化方法。
背景技术
大数据可视化,可视分析是大数据分析的重要方法,大数据可视分析旨在利用计算机自动化分析能力的同时,充分挖掘人对于可视化信息的认知能力优势,将人、机的各自强项进行有机融合,借助人机交互式分析方法和交互技术,辅助人们更为直观和高效地洞悉大数据背后的信息、知识与智慧。主要从可视分析领域所强调的认知、可视化、人机交互的综合视角出发,分析支持大数据可视分析的基础理论,包括支持分析过程的认知理论、信息可视化理论、人机交互与用户界面理论等。
大数据可视分析是指在大数据自动分析挖掘方法的同时,利用支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术,有效融合计算机的计算能力和人的认知能力,以获得对于大规模复杂数据集的洞察力。
降维映射中,机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式;y是数据点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的);f可能是显式的或隐式的、线性的或非线性的。
发明内容
本发明的目的是克服现有技术中存在的不足,提供一种降维映射的大数据可视化方法。
本发明的技术方案是按以下方式实现的,实施步骤如下:
1)、建立一个目标函数,实现一种点对点的降维映射,能保持对应的距离不变;
2)、对目标函数采用不同的最优化方法,如梯度下降法和随机梯度下降法。在这两种最优化方法中,每一步迭代都需要全部数据以形成所需要的梯度,采用类似于神经网络算法算法的位置调节规则,则每步迭代仅需一对数据;以数据为基准,对其他数据映射进行调节;
3)、学习率与权向量调整规则中的学习率可以完全相同,消除额外的控制参数问题。
本发明的优点是:
本发明的一种降维映射的大数据可视化方法和现有技术相比,并不采用常见的Himberg 收缩模型,而根据神经元在这两种空间中对应距离的一致性进行调节, 可以证明这种调节方式类似于随机梯度下降法。本方法具有保距映射的功能,不但实现了数据间距离信息的直观展现,还能在不需要任何额外控制参数的情况下自动避免神经元的过度收缩问题,从而极大地提高算法的可控性和数据可视化的质量。
具体实施方式
下面对本发明的一种降维映射的大数据可视化方法作以下详细说明。
本发明的一种降维映射的大数据可视化方法,对神经元的位置进行调节的依据已不再是Himberg收缩模型,而是根据神经元在原数据空间和低维空间中对应距离(或相似度)的一致性进行调节,目的是为了对数据间的距离(或相似度)信息进行直观展现。在迭代的每一步,以获胜神经元v 为基准,对其他神经元的位置进行调节,如采用距离度量而非相似度量等。
实施步骤如下:
1)、建立一个目标函数,实现一种点对点的降维映射,能保持对应的距离不变;
2)、对目标函数采用不同的最优化方法,如梯度下降法和随机梯度下降法。在这两种最优化方法中, 每一步迭代都需要全部数据以形成所需要的梯度,采用类似于神经网络算法算法的位置调节规则, 则每步迭代仅需一对数据。以数据为基准, 对其他数据映射进行调节;
3)、学习率与权向量调整规则中的学习率可以完全相同,消除额外的控制参数问题。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮集团有限公司,未经浪潮集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510235026.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置