[发明专利]用于使用变异识别数据来确定结构变异和定相的系统和方法有效

专利信息
申请号: 201680007065.6 申请日: 2016-02-09
公开(公告)号: CN107208156B 公开(公告)日: 2021-10-08
发明(设计)人: S·凯莉阿佐波洛-帕纳乔托波洛;P·马克斯;M·史诺-莱文;X·郑;M·雅罗什;S·萨克森诺夫;K·吉欧达;P·穆迪瓦蒂;H·奥多尼兹;J·特里;W·H·希顿 申请(专利权)人: 10X基因组学有限公司
主分类号: C12Q1/6837 分类号: C12Q1/6837;G16B20/00
代理公司: 深圳市百瑞专利商标事务所(普通合伙) 44240 代理人: 金辉
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 使用 变异 识别 数据 确定 结构 系统 方法
【权利要求书】:

1.一种用于非诊断和非治疗目的的确定获自单一生物样本的测试核酸中发生结构变异的似然率的方法,所述方法包括:

在计算机系统处,所述计算机系统具有一个或多个处理器和存储器,所述存储器存储用于由所述一个或多个处理器执行的一个或多个程序:

(A)从将所述测试核酸片段化的多个测序反应获得多个序列读段,其中

所述多个序列读段中的每个相应的序列读段包括第一部分,所述第一部分对应于所述测试核酸的子集;以及第二部分,所述第二部分以多个条形码对所述相应的序列读段的相应的条形码进行编码,并且

每个相应的条形码独立于所述测试核酸的测序数据,并且

所述多个序列读段统一包括所述多个条形码;

(B)获得多个单元的单元信息,其中

所述多个单元中的每个相应的单元表示所述测试核酸的不同部分,

所述单元信息为所述多个单元中的每个相应的单元识别处于所述多个序列读段中的多个序列读段组中的序列读段组,并且

所述多个序列读段组中的每个相应的序列读段组中的每个相应的序列读段的所述相应的第一部分对应于至少部分与所述测试核酸的所述不同部分重叠的所述测试核酸的子集,所述不同部分由对应于所述相应的序列读段组的所述单元表示;

(C)在所述多个单元当中识别对应于所述测试核酸的不重叠的部分的第一单元和第二单元,其中所述第一单元由所述多个序列读段中的第一序列读段组表示,并且所述第二单元由所述多个序列读段中的第二序列读段组表示;

(D)确定表示所述第一序列读段组和所述第二序列读段组共有的条形码的数目可归因于机会的数值概率或似然率的第一值;

(E)响应于确定所述第一值满足预定截止值,针对所述第一单元和所述第二单元共有的每个条形码,获得片段对,从而获得一个或多个片段对,所述一个或多个片段对中的每个片段对(i)对应于所述第一单元和所述第二单元共有的不同条形码;并且(ii)由不同的第一计算片段和不同的第二计算片段组成,其中对于所述一个或多个片段对中的每个相应的片段对:

所述不同的第一计算片段由所述多个序列读段中具有对应于所述相应的片段对的所述多个条形码中的条形码的相应的第一序列读段子集组成,其中

所述相应的第一序列读段子集中的每个序列读段在所述相应的第一序列读段子集中的另一个序列读段的预先确定的遗传距离内,

所述相应的片段对的所述不同的第一计算片段起源于具有对应于所述第一单元中的所述相应的片段对的所述多个条形码中的条形码的第一序列读段,并且

所述相应的第一序列读段子集中的每个序列读段来自所述第一单元,并且

所述不同的第二计算片段由所述多个序列读段中具有对应于所述相应的片段对的所述多个条形码中的条形码的相应的第二序列读段子集组成,其中

所述相应的第二序列读段子集中的每个序列读段在所述相应的第二序列读段子集中的另一个序列读段的预先确定的遗传距离内,

所述相应的片段对的所述不同的第二计算片段起源于具有对应于所述第二单元中的所述相应的片段对的所述多个条形码中的条形码的第二序列读段,并且

所述相应的第二序列读段子集中的每个序列读段来自所述第二单元;以及

(F)基于关于所述一个或多个片段对的第一模型的发生概率和第二模型的发生概率而计算相应的似然率,从而提供所述测试核酸中的结构变异的似然率,其中

(i)所述第一模型规定:观察到所述一个或多个片段对的所述相应的第一计算片段和所述相应的第二计算片段并未给出所述测试核酸序列的结构变异,并且所述相应的第一计算片段和所述相应的第二计算片段是共同分子的一部分,并且

(ii)所述第二模型规定:观察到所述一个或多个片段对的所述相应的第一计算片段和所述相应的第二计算片段已给出所述测试核酸序列的结构变异。

2.如权利要求1所述的方法,其中计算步骤(F)中的所述相应的似然率是所述第一模型的所述发生概率与所述第二模型的所述发生概率之间的比率评分。

3.如权利要求1或2所述的方法,其中所述第一单元和所述第二单元在所述测试核酸上间隔开至少预定数目千碱基。

4.如权利要求3所述的方法,其中所述第一单元和所述第二单元在所述测试核酸上间隔开至少50千碱基。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于10X基因组学有限公司,未经10X基因组学有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201680007065.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top