[发明专利]特征分级无效
申请号: | 200780046259.8 | 申请日: | 2007-12-06 |
公开(公告)号: | CN101558419A | 公开(公告)日: | 2009-10-14 |
发明(设计)人: | A·A·J·简夫斯基;J·D·沙弗;M·R·辛普森 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
主分类号: | G06N3/12 | 分类号: | G06N3/12 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 孙之刚;谭祐祥 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 分级 | ||
发明领域
本发明涉及模式发现(pattern discovery),特别地,涉及包括在所述模式中的测量的分级(rating)。本发明找到了在生物信息学分类器评估方面的特殊应用。
发明背景
最近,在关于人类基因组细节和基因如何在健康和患病对象中找到它们的基因表达(expression)的可获得信息量巨大爆发。现在有实验室技术能够迅速地获取大量的以DNA、RNA、蛋白质和其他有机大分子在生物学对象中的浓度为特征的测量组。
例如,微阵列(microarray)包括载玻片或载玻板,在其上放置c-DNA或另一个结合物(binder)的微小样本“点”的阵列。每个点包括特定的c-DNA或其他与感兴趣的特定大分子绑定的结合物,单个的微阵列可包括成百、成千或更多的这样的点。从病人提取组织样本,感兴趣的分子种(molecular species)(例如,DNA、RNA等)被提取,用发光信号剂或其他标记(marker)处理,并在微阵列上被清洗。在被称为杂交的过程中,组织中特别类型的大分子在具有连接那些特别的大分子的结合物的点上聚集。典型地,使用不同标记(例如不同颜色的发光剂)处理的对比或参考样本也被应用于微阵列。例如使用激光束激活标记以致产生光致发光(photoluminescence),并且检测反应强度以便表征与各种点关联的大分子浓度。这样,包含在生物样本中大量的有机大分子(例如成百、成千或更多)的化验(assay)得以迅速和定量地完成。
质谱分析是快速化验在从病人获取的样本中大量大分子浓度的另一种方法。在该方法中,样本在真空环境中通过激光或其他机制被电离,电离的分子碎片的分子量分布/电荷比率通过离子计数器得以测量。基于各种大分子的已知裂化谱图(cracking pattern),各种大分子的浓度可从质谱推导得出。可替换地,质谱的峰值可用作生物信息学测量数据,而不将质谱图与特定的大分子相关。
生物信息学使用数学方法从微阵列测量、质谱或者其他基因组或有机大分子化验提取有用的生物信息。例如,如果微阵列或质谱中的特定模式能够与特定类型的癌症强烈地联系,则该模式能够被用作检测这种癌症的分类器。这使得能够通过相对非入侵的技术,例如提取血液或脑脊液、获取唾液、小便、大便等样本或者获取液体或组织样本,来早期检测癌症和其他感兴趣的病理。
然而,由于可获得用于开发这种诊断医疗测试的大量信息,因而出现了一个问题。例如,如果想开发使用2500个测量(例如使用50×50点阵列的微阵列)中的五个测量(例如微阵列点、质谱峰值等)的癌症筛选测试,则可用于诊断测试的、可能的五个样本测量子集的搜索空间为:
开发基因组诊断医疗测试的另一个问题是测量的总数很大,而从其提取这些测量的病人数通常小很多。例如,通常的研究可使用50×50的微阵列和40个测试对象的测试组,在测试组中20个对象患有感兴趣的癌症,20个对象是没有癌症的对照标准(control)。生成了100,000个测量的大集合;然而,与很小的测试对象组大小相结合引起了这样的关注:在测量数据中也许存在许多错误的关联,这些关联与在普通人群中与感兴趣的癌症没有关系。
从少数对象提取大量测量是为什么不能获取基于每个测量评估的有用的测量分级的原因。为每个测量能获得的等级数受限于对象的数量,因此少到不能评估每个测量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780046259.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:碳化硅电热元件
- 下一篇:一种会议发起方法和系统