[发明专利]一种染色体非整倍体和拷贝数变异检测方法及其应用有效
申请号: | 201610962141.0 | 申请日: | 2016-11-04 |
公开(公告)号: | CN106520940A | 公开(公告)日: | 2017-03-22 |
发明(设计)人: | 刘萍;史千玉;陈大洋;邱咏;朱珠;夏军;谢林;陈芳;蒋慧;徐讯;牟峰 | 申请(专利权)人: | 深圳华大基因研究院 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68 |
代理公司: | 上海一平知识产权代理有限公司31266 | 代理人: | 陈详,崔佳佳 |
地址: | 518083 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种染色体非整倍体和拷贝数变异检测方法及其应用。具体地,本发明对待测样本的全基因组进行测序,获得样本的测序数据。当胚胎细胞中某条染色体为三体或单体时,该染色体的拷贝率与正常的二倍体相比会有所升高或降低,运用生物统计学进行信息分析,非整倍体可被准确检测。实验结果表明,使用本发明的方法可以简单、快速、准确的对染色体非整倍体和拷贝数变异进行检测。 | ||
搜索关键词: | 一种 染色体 整倍体 拷贝 变异 检测 方法 及其 应用 | ||
【主权项】:
一种检测染色体非整倍体和基因拷贝数变异的方法,其特征在于,所述方法包括步骤:(1)提供待测样本,并对所述样本进行全基因组测序获得全基因组序列;(2)提供检测流程参考文件:(2.1)生成窗口文件提供参考基因组,将参考基因组按照步骤(1)中测得序列的长度随机打断成模拟read(读段)并将其重新比对到参考基因组上;其中,每个窗口含有n个read(读段),相邻窗口间的重合区域含有0.1n~0.4n个读段;(2.2)提供全基因组校正基线文件(2.2.1)提供正常参考样本,并对所述正常参考样本进行全基因组测序;(2.2.2)将所述正常参考样本的全基因组序列比对到所述参考基因组上,提取唯一比对的read,去掉其中比对位置相同的read,(2.2.3)根据(2.2.2)中比对read的坐标信息,计算落入(2.1)中每个窗口内的read数ri,j,对于一个样本计算对应窗口参考基因组上的GC含量,比对上序列的GC含量,相对序列数Ri,j=ri,j/M;其中,M是此样本常染色体的所有窗口的平均read数,ri,j为此窗口的read数;其中,定义gs为比对上序列的GC含量,gr为对应窗口参考基因组上的GC含量;对于gs和gr按x%的GC含量间隔计算在此范围内序列数的中位值则窗口i的矫正系数为则每个窗口矫正后的序列数累计全基因组常染色体的值除以总的窗口数得到矫正值M′,最终对于窗口i矫正后的序列数为针对每种性别的所有参考样本取相同窗口的中位值做为最终基线文件内每个窗口的参考值;(3)待测样本分析(3.1)初始断点查找逐个遍历待测样本全基因组序列中的窗口,选择窗口相邻的左右两端等量的窗口数进行游程检验,得到每个窗口对应的检测P值;对所有P值进行排序去掉非显著的窗口位置,得到初始断点集合B={b1,b2,b3……};(3.2)更新P值对(3.1)中获得的断点,分别对相邻断点左右两端区间内的深度值进行二轮统计得到每个断点对应新的P值;(3.3)最终断点查找在(3.2)断点P值的基础上,对于一特定断点,分别于该特定断点左右两断点区间进行统计检验,并在循环中删除不显著断点;获得每个断点区间的P值和深度值的均值;(3.4)断点过滤根据断点P值显著性判断是否为真实断点,根据深度值的大小判断是缺失还是重复;根据断点区间大小判断检测精度;(3.5)结果报告根据变异区间坐标给出染色体条带信息、所属基因类型、疾病类型等。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因研究院,未经深圳华大基因研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610962141.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种鲷鱼种质鉴定的方法及其应用
- 下一篇:一种东海原甲藻的检测方法