[发明专利]用于检测和描述可视化上的可视特性的方法和系统有效
申请号: | 201310473145.9 | 申请日: | 2013-10-11 |
公开(公告)号: | CN103729539B | 公开(公告)日: | 2017-06-16 |
发明(设计)人: | E·坎多尔干 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京市中咨律师事务所11247 | 代理人: | 于静,张亚非 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 描述 可视化 可视 特性 方法 系统 | ||
技术领域
本发明涉及数据集中的数据特性的分析和可视化。更具体地说,在视图空间内的数据集中检测可视特性,描述和标识可视特性的语义,以及支持与所描述的可视特性的交互以便指导数据集的开发和理解。
背景技术
信息可视化是一种越来越重要的工具,决策者可随意使用它将数据变成消费品。良好的可视化揭示数据中的结构和模式,并且便于探索关系。探索性可视化的挑战是表示复杂数据集(例如,具有多个维度的数据集)并与其交互。例如,对于高维数据,可视表示可以出现混乱,从而导致交互式探索的挑战。相应地,随着数据复杂性和多样性的增加,此类数据的可视化和探索的挑战也增加。
科学、政府和企业的发展取决于以下能力:分析和理解数据,并根据从此类分析获得的洞察进行决策。需要针对在整个企业内进行任何种类决策所涉及的每个人改进数据的可消费性。此类解决方案应使得各种用户、专家和非专家等能够处理和开发对复杂数据集的理解。
发明内容
本发明包括一种用于检测数据集中的可视特性和交互式探索所检测的特性的方法。
在一个方面,检测视图空间中的可视特性并支持与所检测的特性的交互。具体地说,检测视图空间内的一组数据中的可视特性。这包括标识所述视图空间中的潜在数据集群以及建议潜在数据集群以便探索。使用数据空间表征所检测的可视特性,并支持与所检测的特性的交互。所述特性的表征包括在可视化上覆盖所表征的检测的特性。所支持的交互包括跨两个或更多集群探索所检测到的特性以便比较选定数据。
在另一个方面,评估视图空间中的可视特性,并支持与所检测的特性的交互以便探索。更具体地说,一种方法通过标识所述视图空间中的一个或多个潜在数据集群,支持探索所评估的可视特性。在数据空间中表征所评估的特性,这包括定义所述潜在数据集群的特征以及覆盖所述特征以便支持交互。更具体地说,所支持的交互包括跨两个或更多数据集群探索所检测的特性以便比较选定数据。
在一个方面,提供一种用于检测和覆盖有关数据集的特性的计算机程序产品。所述计算机程序产品包括计算机可读非瞬时性存储介质,所述计算机可读非瞬时性存储介质中包含计算机可读程序代码。当执行时,所述计算机可读程序代码导致计算机检测视图空间内的一组数据中的可视特性。可视特性的检测包括标识所述视图空间中的潜在数据集群,以及建议潜在数据集群以便探索。所述计算机程序产品使用数据空间表征所检测的可视特性,以及在可视化上覆盖所表征的检测的特性以便支持交互。所支持的交互包括跨两个或更多集群探索所检测的特性以便比较选定数据。
在另一个方面,提供一种用于标识和可视化数据集特性的系统。在所述系统中提供与数据存储装置通信的处理单元,所述数据存储装置具有至少一个数据集。提供与所述处理单元通信的功能单元。所述功能单元包括用于支持数据探索的工具。所述工具包括检测管理器、表征管理器、可视化管理器和交互管理器。所述检测管理器用于检测视图空间内的一组数据中的可视特性。更具体地说,所述检测管理器标识所述视图空间中的一个或多个潜在数据集群,并建议所述潜在数据集群以便探索。所述表征管理器与所述检测管理器通信,其用于使用数据空间表征所检测的可视特性。提供与所述表征管理器通信的可视化管理器,其用于在可视化上覆盖所表征的检测的特性以支持交互。提供与所述可视化管理器通信的交互管理器,其支持交互,包括跨两个或更多集群探索所检测的特性以便比较选定数据。
在另一个方面,提供一种用于探索数据集的计算机程序产品。所述程序产品包括计算机可读存储介质,所述计算机可读存储介质具有可由处理器执行的程序代码。所述程序代码评估所述视图空间内的一组数据中的可视特性,表征所评估的可视特性,以及覆盖所述特性以便支持与其的交互。
从以下结合附图的对本发明的目前优选实施例的详细描述,本发明的其它特性和优点将变得显而易见。
附图说明
在此参考的附图形成说明书的一部分。附图中示出的特性仅表示本发明的某些示例性实施例,并非表示本发明的所有实施例,除非明确地另有所指。另外不进行相反的暗示,这些附图是:
图1是示出用于集群检测算法的方法的流程图;
图2是示出用于检测数据集中的异常值的方法的流程图;
图3示出具有方向趋势的数据集群的示意图;
图4示出具有径向趋势的数据集群的示意图;
图5是示出用于检测方向趋势的方法的流程图;
图6是示出用于表征集群以呈现分析指导的过程的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310473145.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用