[发明专利]重叠密度(OD)热图及一致性数据显示有效
申请号: | 200780005979.X | 申请日: | 2007-02-21 |
公开(公告)号: | CN101385062A | 公开(公告)日: | 2009-03-11 |
发明(设计)人: | T·阿布什尔;G·M·巴尼克;K·奈德伟得 | 申请(专利权)人: | 生物辐射实验室股份有限公司 |
主分类号: | G09G1/08 | 分类号: | G09G1/08 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 刘 佳 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 重叠 密度 od 一致性 数据 显示 | ||
发明背景
本发明一般涉及数据显示,尤其涉及多个重叠数据集的显示。
在许多领域中,科学家必须了解并找到较大数据量的图案。这种情况的一个示例是新陈代谢学领域,新陈代谢的研究响应于诸如药物或疾病等扰动而变化。新陈代谢学融合统计分析和分析化学技术,诸如核磁共振(NMR)谱学、质谱学(MS)和色谱学。新陈代谢学可导致对许多疾病的更容易、更快和更准确的诊断,因此被预测将成为药物发现和开发的焦点。
通常,当同时显示较大数据量时,使用传统显示系统显现数据中的趋势会是十分困难的(如果并非不可能)。例如,图1示出多个IR光谱的传统图形表示的示例。对每个光谱任意地指派不同且唯一的颜色。虽然不同光谱之间存在明显的重叠,但是使用传统层叠数据显示类型来显现所显示的IR光谱中的最高重叠区是十分困难的(如果并非不可能)。
因此,提供克服以上和其它问题的系统和方法是合需的。此类系统和方法应当提供对重叠数据的有益显示,以及应当允许灵活操作数据显示以提供经提升的数据挖掘和趋势显现能力。
发明概述
本发明提供以有益地简化较大数据集中的趋势可视化的方式生成或提供多个数据集的重叠显示的系统和方法。通常,本发明可应用于期望被显示的任何数据类型的图形显示。例如,本发明可用于分析来自诸如化学信息学、分析信息学、新陈代谢学、化学计量学、基因组学、蛋白质组学及其它的学科的较大量图形数据并适用于包括生命科学和诊断学的科学研究的所有分支。
根据本发明,2维事件计数阵列是针对多个类似数据集生成的。阵列中的每个元素的值表示对应的数据值对x、y在N个数据集中出现的次数,其中每个阵列元素对应于x与y数据值的离散间隔。在一个方面,事件计数过程类似于在所有要被处理的数据集的组合显示上放置2维阵列和对于每个阵列元素计数具有落在相应阵列元素的x-y范围内的数据的数据集的数目。一旦生成阵列,就可通过将期望重叠百分比与每个阵列元素的值作比较来生成重叠密度的图形显示。具有满足期望重叠百分比的值的那些阵列元素作为显示对象被再现。例如,在一个方面,表示特定重叠百分比或重叠百分比范围的OD热图对象可被显示为从用于指示所有N个数据集之间最高重叠区的一种特定色彩、阴影或图案到用于指示所有集之间最低重叠区的第二色彩、阴影或图案且具有指示中间(intermediate)重叠区的色彩、阴影或图案的区域的一种或多种色彩、阴影和/或图案的范围。
根据本发明的一个方面,提供用于生成用来显示多个类似数据集的数据的方法。该方法通常包括:接收N个数据集,每个数据集包括表示量x和y的两对或多对数据值;以及通过对每个阵列元素确定事件计数值M来生成包括X乘Y个元素的事件计数阵列,其中每个事件计数值M是对应数据值对x、y在N个数据集中出现的次数,其中每个阵列元素对应于x和y数据值的离散间隔。该方法还通常包括:接收重叠密度的指示,所述指示表示标识数据重叠百分比的范围;确定落在所标识的重叠百分比范围内的阵列元素;以及生成用于表示阵列中落在所标识的数据重叠百分比范围内的元素的图形显示的图形数据。在某些方面,该指示可标识0%与100%之间的数据重叠百分比范围,其中对应显示表示2个和所有数据集之间的并集。在某些方面,指示标识等于100%的数据重叠百分比,其中显示表示所有N个数据集的交集。在某些方面,指示标识等于0%的数据重叠百分比,其中显示表示所有N个数据集的差异,或所有N个数据集上的唯一值。
根据本发明的另一方面,提供了包括在由处理器执行时控制该处理器生成用于再现多个类似数据集的显示的图形数据的代码的计算机可读介质。该代码通常包括用于生成N个数据集的事件计数阵列的指令,每个数据集包括表示量x和y的两对或多对数据值,阵列通过对每个阵列元素确定事件计数值M来包括X乘Y个元素,其中每个事件计数值M是对应数据值对x、y在该N个数据集中出现的次数,其中每个阵列元素对应于x和y数据值的离散间隔。该代码通常还包括响应于用户输入重叠密度的指示确定落在所标识的重叠百分比内的阵列元素的指令,其中该指示标识数据重叠百分比。该代码通常还包括生成用于表示阵列中落在所标识的数据重叠百分比内的元素的图形显示的图像数据的指令。在某些方面,指示可标识0%与100%之间的数据重叠百分比范围,其中对应显示表示2个和所有N个数据集之间的并集。在某些方面,指示可标识等于100%的数据重叠百分比,其中显示表示所有N个数据集的交集。在某些方面,指示可标识等于0%的数据重叠百分比,其中显示表示所有N个数据集的差异,或所有N个数据集上的唯一值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于生物辐射实验室股份有限公司,未经生物辐射实验室股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780005979.X/2.html,转载请声明来源钻瓜专利网。