[发明专利]一种异构网络可交互可视化方法在审
申请号: | 201410327034.1 | 申请日: | 2014-07-10 |
公开(公告)号: | CN104090957A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 时磊;赵月;林闯 | 申请(专利权)人: | 中国科学院软件研究所;清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 冯艺东 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 交互 可视化 方法 | ||
技术领域
本发明涉及聚类分析、异构网络、数据挖掘、拓扑结构分析、大型数据网络可视化分析等领域,提出了一种基于异构网络节点属性及网络拓扑结构相结合的处理大型异构网络数据的方法。该方法适用于社会化网络、计算机网络、传感器网络及知识网络等典型信息网络数据。是一种可以进行交互分析的可视化展示方法。
背景技术
大数据时代的到来,在短时间内产生了复杂多变的大型数据网络,很多人开始针对这些量大、质杂的网络数据进行分析和深入研究。这些数据网络中,一些是在网络节点上具有不同属性特征的网络类型,一些是拓扑结构和关联关系复杂的网络类型。本发明所指的异构网络数据主要指同时具有以上两种特征的网络,即由一些具有不同属性、类型的数据节点所构成的较为复杂的关系/关联网络。当前,已有一些研究是针对异构网络数据进行聚类分析。主要是根据网络数据上节点所具有的不同属性,进行聚类可视化分析。同时,网络拓扑结构主要指数据节点和数据节点之间因为某种关联关系而相互联系形成的网络,基于网络拓扑结构的聚类分析也较为常见,如图聚类、谱聚类方法。
在可视化研究领域,大部分的网络数据可视化研究均集中于网络拓扑结构的可视化。随着web2.0时代的到来,数据量不断的增加,网络数据的形式已经发生了很大的改变。现有的一些数据网络很多的结点及他们的边都拥有了属性,对于这种具有属性的异构网络可视化,现在仍很少有研究。并且,已知的方法均不能结合网络节点属性及拓扑结构进行联合分析,不能同时基于此两类信息实现可视化展示与分析。例如,Wattenberg对异构网络的可视化分析进行了研究。但是,他仅仅利用了网络节点属性实现可视化,并没有针对以上两种异构网络信息进行二者相结合的可视化研究。
具体说来,针对这一类的大型异构网络数据可视化的研究问题如下:
1)现有的异构网络数据可视化聚类分析研究,有一些是基于网络节点属性数据的聚类分析,一些是基于网络拓扑结构数据的聚类分析,聚类分析方法仅采用网络拓扑结构或节点属性的单一来源,不能实现结合两类数据类型同时进行聚类分析。.例如,在包含“论文、作者、会议/期刊”三类节点的学术异构网络中,已有可视化分析方法不能直观展示“哪些作者的合作者发表了更多的高/中/低引用论文,哪些作者发表的论文有近似的引用率分布”等探索式问题。
现有的大型异构网络数据可视化聚类分析研究,可根据网络节点属性或拓扑结构,生成一定数目的网络节点聚类。然而,这两种方法的聚类结果颗粒度或过于粗糙以至于丢失大量网络细节(如基于节点属性的方法将整个网络压缩为几个节点聚类,对应节点属性的几个取值),或过于细密因此难以布局和展示(如基于网络结构的聚类)。虽然已有一些方法可以聚类数目为输入(如图分割方法),然而用户难以控制并理解聚类结果,且不能支持用户自定义的自顶向下可视化浏览分析过程。
发明内容
针对上述大型异构网络数据的分析问题,本发明的目的在于提出一种异构网络可交互可视化方法。本发明提供了可以解决上述问题的可视数据分析方法以及其可视化实现形式——洋葱图。这是一种可以根据任意节点本身的属性、拓扑关系,或是两类信息的混合来进行聚类分析及可视化展示的大型异构网络数据分析方法。各网络结点或节点聚类都可以灵活的根据属性或拓扑关系进行二次拆分或聚类。在可视化展现上,网络节点根据所在的聚类层级的不同,用多个同心圆来显示,形象如同一个被切开的洋葱。因此,我们的方法以洋葱图命名。
本发明基于国家973科技项目(Supportedby the National Basic Research Program of China under Grant No.2014CB340301)和国家自然科学基金(the National Science Foundation of China (NSFC)under Grant No.61379088)的支持,通过分析网络数据的属性特征及拓扑关系,将大型异构网络数据压缩成分层次的网络节点聚类,提供直观的可视化形式(洋葱图)展示所计算的网络节点聚类及聚类之间的关系,并通过简单、易用的交互形式来指引用户分层浏览并可视化分析大型异构网络数据的聚类结果。特别地,本方法支持用户按照自己的分析需求,选择特定的异构网络局部数据,并从将所选择的某个层次的网络节点聚类,继续按照分析需求逐层放大(向较低层次聚类)或合并(向较低层次聚类)。通过在同一异构网络可视化视图种展示不同层次的聚类粒度,实现用户关注的局部异构网络数据的详细关联分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所;清华大学,未经中国科学院软件研究所;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410327034.1/2.html,转载请声明来源钻瓜专利网。