[发明专利]基于分子标签的集合的生物标志物有效
申请号: | 201080021694.7 | 申请日: | 2010-05-18 |
公开(公告)号: | CN102439600A | 公开(公告)日: | 2012-05-02 |
发明(设计)人: | A·贾内夫斯基;V·瓦拉达恩;N·班纳吉 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 黄云铎;陈松涛 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分子 标签 集合 生物 标志 | ||
技术领域
本发明总体涉及生物信息学领域。更具体而言,本发明涉及一种用于基于对生物学数据的多个标签进行排序来形成新型(novel)的生物学数据标签的方法。本发明还涉及一种用于对多个分子标签进行比较的装置、一种形成新型的标签的装置、一种计算机程序产品以及所述方法和装置的使用。
背景技术
已经知道,对生物样本的高吞吐量的分子分布分析得到了用于将样本划分成具体的类别的标签。这样的群组可以是健康状况诊断(正常或疾病)、病程(侵袭性的或非侵袭性的)或治疗选择(药物响应)。分子标签就是标签的例子。
诸如分子标签的标签通常是通过临床研究发现并加以验证的,但是已经证实在解释相同的临床问题时这样的标签的内容也存在很大的易变性。这主要是由于可用于分析的数据的本质导致的——高吞吐量测量所提供的特征有几万乃至几十万个,而测量点(样本)的数量则为几百个。如果特征的数量和样本的数量存在几个数量级的差异,那么其又被称为维数(dimensionality)的制约(curse)。此外,即使在同一临床研究和同一发现方法的背景下,情况也往往是,在参数的选择存在易变性或者采用不同的随机化方式的情况下重复完全相同的流程将导致尽管类似但是不同的标签。
本领域内的快速发展产生了很多将患者划分到具体的类别中的标签。这一数据往往不连贯,而且多变,因为没有具体的标准存在。生物系统的复杂性质以及对其进行研究的方式也使得对不同来源的基因组身份的集合进行比较存在困难。
因而,一种改进的生物学数据分析方法将是有利的,尤其是能够增加灵活性、成本效率、速度和/或分析精确度的方法将是有利的。
发明内容
因此,本发明寻求以单独或组合的方式缓和、减轻或消除一个或多个上文给出的本领域的缺陷和不利因素。这一目的是通过提供根据随附独立权利要求的用于对生物学数据的多个标签进行分组的方法、装置、计算机程序产品和使用来实现的。
根据本发明的一般解决方案是实现对具有相同预测值的多个标签的测量。
根据本发明的第一方面,提供了一种基于对生物学数据的多个标签的集合进行分析来形成包括若干特征(F={F1,F2,…,Fn})的生物学数据的新型标签的方法。所述方法包括通过对生物学数据运行N次特征子集选择算法来获得生物学数据的多个标签的集合的步骤。对于若干次运行({r1,r2,…,rN})中的每次运行(ri)而言,所述方法还包括下述步骤:形成具有尺寸(F×F)的第一矩阵(Mi),其中,在运行ri中所述第一矩阵(Mi)的每个矩阵元(i,j)基于每个对应的特征对(FiFi)受分析标签中的共同出现来量化所述特征对;以及形成具有尺寸(F×N)的第二矩阵(T),其中,所述第二矩阵(T)的每个元(T(i,j))被分配以对应的第一矩阵(Mi)的对应行(Fi)的和。此外,所述方法还包括形成具有尺寸(F)的向量(C),其中,所述向量的每个元(CFi)被分配以所述第二矩阵(T)的所有列(1到N)的对应行(Ti)的平均值。所述方法还包括按照降序对向量(C)的每个值排序(sort),从而使得由所述向量(C)的每个元表示的每个特征(Fi)按照降序排列。所述方法还包括通过合并至少两个具有相似排位的标签的特征而基于经排列的特征形成新型的标签的集合。
根据本发明的第二方面,提供了一种装置,其包括多个单元,所述单元被配置为在彼此存在操作性连接时执行根据本发明的第一方面的步骤。
根据本发明的第三方面,提供了一种计算机程序产品,其包括由计算机进行处理的计算机程序。所述计算机程序包括用于执行根据本发明的第一方面的方法的代码段。
根据本发明的第四方面,提供了根据第一方面的方法和根据第二方面的装置在临床数据的统计分析中的使用。
根据本发明的第五方面,提供了根据第一方面的方法和根据第二方面的装置在基于多个分子标签的化验设计方面的使用。
根据本发明的第六方面,提供了根据第一方面的方法和根据第二方面的装置在基于多个分子标签的化验解释方面的使用。
在从属权利要求中限定了本发明的实施例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080021694.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用