[发明专利]一种消除高通量测序引入的GC偏差及对染色体拷贝数变异的检测方法有效
申请号: | 201410394930.X | 申请日: | 2014-08-12 |
公开(公告)号: | CN104133914B | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 郑海灵;陈会飞;陈洪亮;祝兴强;林静;张阿虹;徐欢 | 申请(专利权)人: | 厦门万基生物科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京远大卓悦知识产权代理事务所(普通合伙)11369 | 代理人: | 史霞 |
地址: | 361100 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及高通量测序技术领域,特别是指一种消除高通量测序引入的GC偏差及对染色体拷贝数变异的检测方法,通过对人类基因组进行处理,并结合高通量测序得到的基因序列进行比对,对基因序列进行校正后,在染色体间做T‑test,从而判断混合样本中染色体是否存在整倍体变异,很好地解决了高通量测序引入的GC偏差的技术问题,从而使得高通量测序在混合样本中染色体拷贝数变异的检测上的应用成为可能。 | ||
搜索关键词: | 一种 消除 通量 引入 gc 偏差 染色体 拷贝 变异 检测 方法 | ||
【主权项】:
一种消除高通量测序引入的GC偏差方法,其特征在于:包括如下步骤:步骤一,对人类基因组进行分析,找出所有一定长度的唯一比对序列;步骤二,将上述唯一比对序列按照在人类基因组上的位置顺序,在染色体内以一定数目的唯一比对序列划分一个窗口,记录下每个窗口的起始位置和终止位置;步骤三,利用高通量测序平台对待测混合样本进行全基因组测序;步骤四,将步骤三得到的序列统一取出与步骤一中的唯一比对序列长度相同的前部序列,同时去除测序质量较低的序列;步骤五,将步骤四得到的前部序列比对到人类基因组,去除多匹配、非完全匹配和没有比对到染色体的序列;步骤六,将步骤五得到的序列定位到步骤二划分的窗口中,统计每个窗口内所有序列的GC值,并忽略窗口内序列数目大于99.9分位数的窗口;步骤七,根据步骤六得到的窗口和每个窗口的序列数目和GC值,对所有窗口的序列数目和GC值进行拟合,得到二者间的拟合关系;步骤八,根据步骤七得到的拟合关系,用每个窗口的GC值预测得到新的序列数目,记做预测值,计算公式如下:prei,j=f(GCi,j)其中i=1,2,3……22,X,Y;prei,j代表预测值,f(GCi,j)代表第i条染色体第j个窗口序列数目和GC值之间的拟合关系;步骤九,根据步骤八得到的预测值,计算出每个窗口预测值与最大值之间的差距,计算公式如下:difi,j=max(pre)‑prei,j其中,i=1,2,3……22,X,Y;difi,j是第i条染色体第j个窗口的预测值和所有窗口预测值的差,max(pre)是所有窗口中最大的预测值;步骤十,根据步骤六得到的窗口和每个窗口的序列数目,将每个窗口的序列数目加上步骤九得到的差距,计算公式如下:adjusti,j=ni,j+difi,j其中,i=1,2,3……22,X,Y;adjusti,j为第i条染色体的第j个窗口校正后的值,ni,j为统计的每个窗口原始序列数目。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门万基生物科技有限公司,未经厦门万基生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410394930.X/,转载请声明来源钻瓜专利网。