[发明专利]确定胎儿脊髓性肌肉萎缩症基因单体型的方法及系统有效
申请号: | 201810072663.2 | 申请日: | 2018-01-25 |
公开(公告)号: | CN108070648B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 蒋馥蔓;曾晓静;李胜;杜伯乐;张春生;郭宇来;王阳;朱文涛 | 申请(专利权)人: | 广州精科医学检验所有限公司 |
主分类号: | C12Q1/6883 | 分类号: | C12Q1/6883;C12Q1/6869;G16B30/00;G16B20/50;G16B20/20;G16B20/30;G16B40/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 许飞 |
地址: | 510663 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 胎儿 脊髓 肌肉 萎缩 基因 体型 方法 系统 | ||
1.一种确定胎儿脊髓性肌肉萎缩症基因单体型的系统,所述系统包括:
构建三代测序文库设备,所述构建三代测序文库设备用于基于血液样本构建三代测序文库,所述血液样本取自胎儿父亲和母亲的血样;
三代测序设备,所述三代测序设备用于对所述三代测序文库进行第三代测序,获得三代测序结果;
确定父母脊髓性肌肉萎缩症基因单体型设备,所述确定父母脊髓性肌肉萎缩症基因单体型设备用于根据三代测序结果确定父亲和母亲脊髓性肌肉萎缩症基因单体型;
构建二代测序文库设备,所述构建二代测序文库设备用于基于检测样本构建二代测序文库,所述检测样本取自孕妇外周血血样;
二代测序设备,所述二代测序设备用于对所述二代测序文库进行第二代测序,获得二代测序结果;
确定胎儿脊髓性肌肉萎缩症基因单体型设备,所述确定胎儿脊髓性肌肉萎缩症基因单体型设备用于根据二代测序结果及所述父亲和母亲脊髓性肌肉萎缩症基因单体型确定胎儿脊髓性肌肉萎缩症基因单体型;
所述确定父母脊髓性肌肉萎缩症基因单体型设备还包括:
第一比对装置,所述第一比对装置用于将通过三代测序设备获得的三代测序结果与参考人类基因组序列进行比对,得到经过比对的测序数据集合;所述比对的软件采用Blasr;所述参考人类基因组为Hg19;
筛选装置,所述筛选装置用于在所述经过比对的测序数据集合中筛选比对得分最高的序列,获得唯一比对序列集合;
计算碱基深度装置,所述计算碱基深度装置用于计算所述唯一比对序列集合中每一条序列上的目标区域里边每个位点不同的碱基深度;
筛选杂合位点装置,所述筛选杂合位点装置用于根据所述每一条序列上每个位点不同的碱基深度筛选出杂合的单核苷酸多态性位点或小片段插入缺失的位点;所述筛选的方法包括:按照突变的碱基深度除以位点的深度大于0.2,小于0.8,并且位点的深度大于20X的标准进行筛选;
选择相邻杂合位点装置,所述选择相邻杂合位点装置用于根据所述筛选出的杂合的单核苷酸多态性位点或小片段插入缺失的位点,选择包含两个相邻杂合单核苷酸多态性或小片段插入缺失位点的序列片段;对每两个相邻杂合单核苷酸多态性位点或小片段插入缺失位点找出所对应的序列片段,选择包含所述两个相邻杂合位点排列类型的序列数最多的两个相邻杂合位点排列类型所对应的序列片段;
判断位点装置,所述判断位点装置用于对所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失的位点进行判断,得到两个相邻杂合位点的连接类型;
将低质量值的序列片段进行分析和过滤,所述低质量值的序列片段是指序列片段上含有低质量值的碱基以及每两个相邻的单核苷酸多态性位点或小片段插入缺失位点无法对应的序列片段;所述低质量值的碱基是指碱基为N的碱基;
计算过滤后的序列片段上所述两个相邻杂合突变位点出现的概率值,对每一种连接类型给出一个概率值,所述概率值包括贝叶斯概率或优势对数比LOD值;
根据所述两个相邻杂合位点出现的概率值,选择相邻两个杂合位点概率最大的连接类型;判断连接类型装置,所述判断连接类型装置用于判断所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型,也即总体的单体型;包括:
采用数学统计方法对所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点进行计算,得到所有序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接类型,也即总体的单体型,所述数学统计方法包括图论或最优解方法;
第一修正装置,所述修正装置用于对所述总体的单体型进行修正,得到父亲和母亲的单体型;
对所有所述序列片段上两个相邻杂合单核苷酸多态性或小片段插入缺失位点的连接顺序进行连接关系的强弱判断,所述判断的标准包括支持的序列数、计算的概率值或优势对数比值;
对所述两个相邻杂合位点的连接关系为弱联系的位点进行重新判断,选择覆盖所述相邻两个相邻杂合位点及其相邻多个位点的序列,判断所述序列的支持情况,根据所述支持情况对所述弱联系的位点进行修正,所述修正的标准包括跨越多个位点的序列数或支持附近单体型的位点数;
所述确定胎儿脊髓性肌肉萎缩症基因单体型设备还包括:
过滤装置,所述过滤装置用于将所述二代测序结果进行过滤,得到过滤后的测序结果,所述过滤的条件包括序列中含有N的比例,以及含有低质量碱基数的比例,所述N为测序得到的碱基无法判断;包括:
过滤一条序列中N的比例大于10%的序列,以及一条序列中质量值小于15的比例大于50%的序列;
第二比对装置,所述第二比对装置用于将过滤后的测序结果与参考人类基因组序列进行比对,获得经过比对的测序数据集合;所述比对的软件采用BWA或SOAP;所述参考人类基因组为Hg19;
第二修正装置,所述第二修正装置用于将经过比对的测序数据集合进行质量值修正和局部重比对,获得修正后的测序数据;所述质量值修正和局部重比对采用GATK软件进行;
筛选父母连接位点装置,所述筛选父母连接位点装置用于确定所述修正后测序数据里的含有单核苷酸多态性位点或小片段插入缺失的位点,筛选出对应所述父亲和母亲单倍体型的连接位点;进一步包括:计算所述在孕妇外周血的二代测序数据中对应父亲和母亲单倍体型的连接位点的碱基深度,所述碱基深度采用samtools或GATK进行计算;
判断遗传父母单体型装置,所述判断遗传父母单体型装置用于对筛选出的对应所述父亲和母亲单倍体型的连接位点进行选择,当判断遗传母亲哪一条单体型时,选择为母亲杂合,父亲纯合的位点;当判断遗传父亲哪一条单体型时,选择为父亲杂合,母亲纯合的位点;所述选择为母亲杂合,父亲纯合的位点包括如下步骤:
S651、过滤父亲杂合位点;
S652、过滤低的碱基深度的位点;
S653、过滤未在母亲单体型中出现的位点;
所述选择为父亲杂合,母亲纯合的位点包括如下步骤:
S651、过滤母亲杂合位点;
S652、过滤低的碱基深度的位点;
S653、过滤未在父亲单体型中出现的位点;
胎儿浓度计算装置,所述胎儿浓度计算装置用于根据所述父母纯合并且不同的位点计算胎儿浓度;所述计算的方法包括根据
所述父母纯合并且不同的位点,计算在孕妇外周血中母亲碱基的总深度为A,父亲碱基的总深度为B,则胎儿浓度为f=2B/(A+B);
判断胎儿脊髓性肌肉萎缩症基因单体型装置,所述断胎儿脊髓性肌肉萎缩症基因单体型装置用于根据所述胎儿浓度用隐马模型判断胎儿脊髓性肌肉萎缩症基因单体型,包括:
计算筛选出的母亲杂合,父亲纯合的位点在孕妇外周血的二代测序数据中的质量值;
根据所述胎儿浓度,计算在孕妇外周血中每个筛选出的母亲杂合,父亲纯合位点的测序分布情况的概率;
根据所述质量值、测序分布情况的概率用隐马模型和viterbi算法计算出最优的遗传路径,判断胎儿遗传了母亲的哪一条单倍体型;
在孕妇外周血的二代测序数据中筛选出通过三代数据中得到的父亲杂合,母亲纯合的位点,通过多个位点比对到父亲的两条单倍体型上来确定遗传了父亲的哪一条单倍体型,所述父亲杂合,母亲纯合的位点为外周血数据中与母亲纯合位点不一致的位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州精科医学检验所有限公司,未经广州精科医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810072663.2/1.html,转载请声明来源钻瓜专利网。