[发明专利]高通量测序数据的平行比较分析有效
申请号: | 201710190109.X | 申请日: | 2011-12-20 |
公开(公告)号: | CN106971089B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | J·Z·森波;D·豪斯勒 | 申请(专利权)人: | 加利福尼亚大学董事会 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/20;G16B50/30 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵蓉民;王永伟 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通量 序数 平行 比较 分析 | ||
本发明涉及高通量测序数据的平行比较分析。通过利用相对于参考基因组序列的子串的已知位置递增地同步序列串,在子串的比对基础上构成差异序列对象。然后生成输出文件,其包含关于仅参考基因组的相关变化。
本申请是分案申请,原申请的申请日为2011年12月20日,申请号为201180076272.4(PCT/US2011/001996),发明名称为“半目半目:高通量测序数据的平行比较分析”。
与其他申请的关系
本申请涉及2011年11月18日提交的名为“半目半目(Bambam):高通量测序数据的平行比较分析”的美国非临时专利申请序号13/373,550,并且要求其优先权,在此将其全部内容引入作为参考。
本发明部分利用下列美国联邦机构的资金进行:国家癌症研究所编号1U24CA143858-01。美国联邦政府对本发明拥有一定权利。
技术领域
本发明涉及处理个体或对象生物途径的数据和鉴定其组分从而确定个体或对象是否具有病症或疾病危险的方法。本方法可用作利用 SAM/BAM格式的文件中存储的短读取比对对个体或对象的肿瘤和种系测序数据进行比较分析的工具。数据处理方法计算总拷贝数和等位基因特异的拷贝数,使等位基因失衡区域的种系序列分阶,发现体细胞和种系序列变体,并推断体细胞和种系的结构变化区域。本发明还涉及利用本方法诊断对象是否易患癌症、自身免疫性疾病、细胞周期疾病或其他疾病。
背景技术
现代癌症治疗的核心前提是,患者诊断、预后、危险评估和治疗响应预期可通过癌症分类得到提高,癌症分类基于肿瘤基因组、转录和外因基因组特征,同时还有诊断时收集的相关临床信息(例如,患者病史、肿瘤组织学及阶段)以及随后的临床后续数据(例如,治疗方案和疾病复发事件)。
在测序中最新进展已经导致用于个体生物体和生物体组织以及用于不同群体和甚至物种的大量基因组和亚基因组数据。这促使利用基因组、转录和/或表观遗传信息的各种疾病、预后/危险评估,和甚至治疗响应预测的基于基因组的个性化治疗或诊断的发展。
由于基因组数据的量已达到显著水平,计算要求和有意义的输出生成的方式已经变得具有挑战性。例如,多个肿瘤和匹配的正常全基因组序列现在可用自像“癌症基因组图谱”(TCGA)的项目,并且提取相关的信息很困难。其通过需要高的基因组测序的覆盖(例如,大于30倍)被进一步混合以获得统计学上相关数据。即使在压缩形式中,基因组信息可经常达到数以百计的千兆字节,并且比较多个这种大型数据集的分析在大多数情况下是缓慢的且难以管理,但是,是绝对必要的,以便发现发生在相对于第二样品的任何给定的样品的许多基因组变化。
乳腺癌在临床上和基因组方面是异质的并由几种病理和分子方面不同的亚型组成。在各亚型中,患者对常规和目标治疗剂的响应不同,推动了标记物引导的治疗策略的发展。乳腺癌细胞系的集合反映出多种在肿瘤中发现的分子亚型和途径,表明用候选治疗性化合物治疗细胞系可引导鉴定分子亚型、途径和药物响应之间的关联。在77种治疗性化合物的测试中,几乎全部药物在这些细胞系中显示差异响应并约一半显示亚型、途径和/或基因组异常-特异性响应。这些观察结果暗示了可指示临床药物调配的响应和抗性机制以及有效组合药物的尝试。
目前需要提供可用于表征、诊断、治疗和确定疾病和病症结果的方法。
发明内容
本发明人已经发现比较基因组分析的各种系统和方法,其允许以不需要进行处理的多个规模文件的形式以及避免生成具有相对于基因组畸变的相对低的信息密度的相似的规模文件的形式迅速产生有意义的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于加利福尼亚大学董事会,未经加利福尼亚大学董事会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710190109.X/2.html,转载请声明来源钻瓜专利网。