[发明专利]用于使用变异识别数据来确定结构变异和定相的系统和方法有效
申请号: | 201680007065.6 | 申请日: | 2016-02-09 |
公开(公告)号: | CN107208156B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | S·凯莉阿佐波洛-帕纳乔托波洛;P·马克斯;M·史诺-莱文;X·郑;M·雅罗什;S·萨克森诺夫;K·吉欧达;P·穆迪瓦蒂;H·奥多尼兹;J·特里;W·H·希顿 | 申请(专利权)人: | 10X基因组学有限公司 |
主分类号: | C12Q1/6837 | 分类号: | C12Q1/6837;G16B20/00 |
代理公司: | 深圳市百瑞专利商标事务所(普通合伙) 44240 | 代理人: | 金辉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供用于使用获自生物样本的核酸的变异识别数据来确定结构变异和定相的系统和方法。获得序列读段,每个序列读段包括对应于所述测试核酸的子集的一部分以及对独立于所述测序数据的条形码进行编码的一部分。获得单元信息。每个单元表示所述样本核酸的不同部分。每个单元对应于由所述序列读段形成的多个序列读段组中的序列读段组,使得相应的序列读段组中的每个序列读段对应于由对应于所述相应的组的所述单元表示的所述核酸的子集。二项式测试识别单元对,所述单元对具有比偶然预期更多的共同具有相同条形码的序列读段。概率模型从这些单元对的所述序列读段确定结构变异似然率。 | ||
搜索关键词: | 用于 使用 变异 识别 数据 确定 结构 系统 方法 | ||
【主权项】:
一种在获自生物样本的测试核酸的测序数据中检测结构变异的方法,所述方法包括:在计算机系统处,所述计算机系统具有一个或多个处理器和存储器,所述存储器存储用于由所述一个或多个处理器执行的一个或多个程序:(A)获得多个序列读段,其中所述多个序列读段中的每个相应的序列读段包括第一部分,所述第一部分对应于所述测试核酸的子集;以及第二部分,所述第二部分以多个条形码对所述相应的序列读段的相应的条形码进行编码,每个相应的条形码独立于所述测试核酸的所述测序数据,并且所述多个序列读段统一包括所述多个条形码;(B)获得多个单元的单元信息,其中所述多个单元中的每个相应的单元表示所述测试核酸的不同部分,所述单元信息为所述多个单元中的每个相应的单元识别多个序列读段组中的序列读段组,其中所述多个序列读段组中的每个序列读段组中的每个序列读段在所述多个序列读段中,并且所述多个序列读段组中的每个相应的序列读段组中的每个相应的序列读段的所述相应的第一部分对应于至少部分与所述测试核酸的所述不同部分重叠的所述测试核酸的子集,所述不同部分由对应于所述相应的序列读段组的所述单元表示;(C)确定所述多个序列读段中的第一序列读段组中的唯一条形码的数目,其中所述第一序列读段组是所述多个单元中的第一单元,所述唯一条形码同样发现于所述多个序列读段的第二序列读段组,其中所述第二序列读段组是所述多个单元中的第二单元;以及(D)通过基于所述数目的度量与阈值准则的比较来确定所述数目可归因于机会的概率或似然率,其中当所述度量满足所述阈值准则时,认为已在以下各处发生结构变异:(i)由所述第一序列读段组表示的所述测试核酸的所述不同部分,和/或(ii)由所述第二序列读段组表示的所述测试核酸的所述不同部分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于10X基因组学有限公司,未经10X基因组学有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201680007065.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种新型管材挤出设备口模
- 下一篇:一种电动硬度计