[发明专利]确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质有效
申请号: | 201280067240.2 | 申请日: | 2012-01-20 |
公开(公告)号: | CN105392894B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 殷旭阳;张春雷;陈盛培;张春生;潘小瑜;蒋慧;张秀清 | 申请(专利权)人: | 深圳华大基因股份有限公司 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869;G06F19/22 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 李志东 |
地址: | 518083 广东省深圳市盐田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了确定样本基因组中是否存在拷贝数变异的方法和适于执行该方法的系统和计算机可读介质。其中,确定样本基因组中是否存在拷贝数变异的方法,包括步骤:对所述样本基因组进行测序,以便获得由多个测序序列构成的测序结果;将所述测序结果与参照基因组序列进行比对,以便确定所述测序序列在所述参照基因组序列上的分布;基于所述测序序列在参照基因组序列上的分布,在所述参照基因组序列上确定多个突破点,所述突破点两侧的测序序列数目存在显著差异;基于所述多个突破点,在所述参照基因组上确定检验窗口;基于落入所述检验窗口的测序序列,确定第一参数;以及基于所述第一参数与预定阈值的差异,确定所述样本基因组,针对所述检验窗口是否存在拷贝数变异。 | ||
搜索关键词: | 样本基因组 测序序列 基因组序列 拷贝数 测序 计算机可读介质 检验 显著差异 基因组 比对 | ||
【主权项】:
1.一种确定样本基因组中是否存在拷贝数变异的方法,所述方法用于非诊断目的,其特征在于,包括以下步骤:对所述样本基因组进行测序,以便获得由多个测序序列构成的测序结果;在参考基因组序列上划分多个预定长度的一级窗口,将所述测序结果与参照基因组序列进行比对,以便确定落入各一级窗口中的测序序列;基于所述落入各一级窗口中的测序序列,在所述参照基因组序列上确定多个突破点,所述突破点两侧的测序序列数目存在显著差异;基于所述多个突破点,在所述参照基因组上确定检验窗口;基于落入所述检验窗口的测序序列,确定第一参数;以及基于所述第一参数与预定阈值的差异,确定所述样本基因组,针对所述检验窗口是否存在拷贝数变异,其中,基于所述多个突破点,在所述参照基因组上确定检验窗口进一步包括:1)确定多个候选突破点,其中在所述候选突破点的前后均存在其他突破点;2)确定每个候选突破点的p值,并剔除p值最大的候选突破点;3)对剩余的候选突破点重复步骤2),直到剩余候选突破点的p值均小于终止p值,所述剩余候选突破点作为经过筛选的候选突破点;以及4)确定相邻两个经过筛选的候选突破点之间的区域为检验窗口,其中,通过下列步骤确定所述候选突破点的p值:将所述候选突破点与相邻的上一个突破点之间的区域作为第一候选区域,将所述候选突破点与相邻的下一个突破点之间的区域作为第二候选区域;对所述第一候选区域和第二候选区域中所包含一级窗口的标准化的测序序列数目Zi 进行游程检验,以便确定所述候选突破点的p值,其中,针对所述候选突变点,在所述候选突变点两侧各取相同数目的一级窗口,并且计算每个一级窗口的相对测序序列数目Ri ,其中i表示一级窗口的编号,其中,所述相对测序序列数目Ri 是通过下列公式确定的: R i = log 2 ( r i r ‾ ) ]]> 其中ri 表示落入第i一级窗口的测序序列数目, n表示一级窗口的总数目;所述终止p值是通过下列步骤确定的:利用对照样品的测序结果,重复在参照基因组上确定检验窗口的操作,并记录每次被剔除候选突破点的p值,直到候选突破点的数目为零;以及基于被剔除候选突破点的p值分布,确定所述终止p值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因股份有限公司,未经深圳华大基因股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201280067240.2/,转载请声明来源钻瓜专利网。
- 上一篇:改进的测定方法
- 下一篇:组合物及使用其的液晶显示元件