[发明专利]鉴定基因组中的变异的定相和连接方法有效
申请号: | 201811311487.X | 申请日: | 2014-10-01 |
公开(公告)号: | CN109599148B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | B.G.克马尼;R.德马纳克;B.A.彼得斯 | 申请(专利权)人: | 深圳华大智造科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张文辉;凃滔 |
地址: | 518083 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 鉴定 基因组 中的 变异 连接 方法 | ||
1.一种通过分析自生物体获得的样品来检测生物体的基因组中的半合子缺失的方法,所述方法包括:
从所述生物体的多个核酸分子的测序接收序列数据,其中对于所述多个核酸分子的每一个的序列数据包括:
所述核酸分子的至少一部分的一个或多个序列读出,和
对应所述一个或多个序列读出的标签,所述标签指示所述核酸分子的来源;
对于所述多个核酸分子的每一个:
通过计算机系统,将所述核酸分子的至少一个序列读出定位到参考基因组;
通过计算机系统,鉴定一个或多个连接到第一区域的het,其中每个het具有对应第一单体型的第一等位基因和对应第二单体型的第二等位基因;
通过计算机系统,鉴定第一组共享的标签,每个共享的标签对应:
定位到所述参考基因组的第一区域的一个或多个序列读出,和
定位到一个或多个连接到第一区域的het之一并包括对应的第一等位基因的至少一个序列读出;
确定第一量的序列读出,其对应共享的标签并定位到第一区域;
标准化所述第一量以获得标准化的第一量;和
将所述标准化的第一量与第一截留值比较以确定所述第一单体型在第一区域中是否包括缺失。
2.权利要求1的方法,其中所述多个核酸分子分布于所述样品的多个等分试样中,每个等分试样包括片段化出所述核酸分子的一个或多个长核酸分子,并且其中所述标签指示所述核酸分子来自哪个等分试样。
3.权利要求1的方法,其中两个核酸分子上具有相同的标签指示所述两个核酸分子来自相同的长核酸分子。
4.权利要求1的方法,进一步包括:
将标准化的第一量与第二截留值比较以确定所述第一单体型在所述第一区域中是否包括插入,其中所述第二截留值小于所述第一截留值。
5.权利要求1的方法,进一步包括:
将标准化的第一量与第二截留值比较以确定所述第一单体型是否包括对应所述第一区域的扩增,其中所述第二截留值比所述第一截留值大。
6.权利要求1的方法,进一步包括:
鉴定第二组的第二标签,每个第二标签对应:
定位到所述参考基因组的第一区域的一个或多个序列读出,和
定位到一个或多个连接到第一区域的het之一并包括对应的第二等位基因的至少一个序列读出;
确定第二量的序列读出,其对应所述第二标签并定位到所述第一区域;
使用所述第二量来标准化所述第一量。
7.权利要求6的方法,其中使用所述第二量来标准化所述第一量包括:
计算所述第一量和所述第二量之间的参数。
8.权利要求7的方法,其中所述参数包括所述第一量和所述第二量之间的差。
9.权利要求7的方法,其中所述参数包括所述第一量和所述第二量之间的比率。
10.权利要求7的方法,其中所述第一截留值取决于定位到所述参考基因组的序列读出的数量。
11.权利要求1的方法,其中标准化所述第一量使用定位到所述参考基因组的序列读出的数量。
12.权利要求11的方法,其中所述第一区域对应连续的位置,且其中标准化所述第一量包括:
确定与所述第一区域相同长度的多个其它区域的序列读出的平均数量。
13.权利要求12的方法,进一步包括:
通过排除具有高于阈值的GC含量或具有大于阈值的序列平均数量的区域,从区域组中选择所述其它区域。
14.权利要求1的方法,其中鉴定第一het连接到第一区域包括:
鉴定对应定位到所述第一区域的序列读出和对应定位到所述第一het的序列读出的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大智造科技有限公司,未经深圳华大智造科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811311487.X/1.html,转载请声明来源钻瓜专利网。