[发明专利]一种基于三代测序平台的HLA基因分型方法有效

专利信息
申请号: 201810191663.4 申请日: 2018-03-08
公开(公告)号: CN108460246B 公开(公告)日: 2022-02-22
发明(设计)人: 郎娜;金杰;龚淳;杨帆;周家蓬;汪德鹏 申请(专利权)人: 北京希望组生物科技有限公司
主分类号: G16B30/10 分类号: G16B30/10;C12Q1/6869
代理公司: 北京纪凯知识产权代理有限公司 11245 代理人: 陆惠中;王永伟
地址: 102206 北京市昌平区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于三代测序平台的HLA基因分型方法,包括以下步骤:(1)对需要分型的HLA基因进行PCR扩增;(2)PCR所得产物检测合格后,进行三代测序,获得原始数据;(3)将原始数据与参考基因序列进行长序列比对;(4)比对后对测序错误进行矫正;(5)分相得到单体型序列;(6)分型判断。相比于现有的HLA基因分型方法,本发明的HLA分型方法对计算资源要求少、分型快、分辨率高,对临床移植组织配型、群体遗传学、人类学和进化学等应用和基础研究工作具有重要价值。
搜索关键词: 一种 基于 三代测序 平台 hla 基因 方法
【主权项】:
1.一种基于三代测序平台的HLA基因分型方法,包括以下步骤:(1)对需要分型的HLA基因进行PCR扩增;(2)PCR所得产物检测合格后,进行三代测序,获得原始数据;(3)将原始数据与参考基因序列进行长序列比对,所述参考基因序列为IPD‑IMGT/HLA数据库中的一条最长序列;(4)比对后采用如下程序对测序错误进行矫正:(4.1)编码原始比对矩阵经过和参考序列的比对,所述HLA基因组成了由碱基构成的特有矩阵;使用samtools软件的tview命令,输出文本格式的碱基与参考基因序列的比对矩阵;以参考基因的位置为横坐标、以i表示,以深度为纵坐标、以j表示,矩阵组成单元以x表示;设置初始阈值y,所述y表示默认的错误率,所述错误率为测序错误占总深度的比例,所述错误率为10%;每个i位置的碱基纵向的总深度为Dep_total[i];统计每个i位置对应的所有j位置x的数量Num(x),计算x对应的深度Dep(x);(4.2)纯合、杂合位点的可视化矫正(4.2.1)设置初始错误率阈值y,所述y为10%;(4.2.2)确定扩增子杂合等位型j位置及比例;对于每个i位置,当Dep(x)>y,使用Dep(x1)代表最大深度碱基类型的深度,仅次于Dep(x1)的深度,用Dep(x2)表示,若有第三大碱基类型的深度,为Dep(x3);对整个扩增子的杂合比例进行计算,当Dep(x2)/(Dep(x1)+Dep(x2))<20%时,假设其为纯合子;当Dep(x2)/(Dep(x1)+Dep(x2))>=20%时,假设其为杂合二倍型别,选取SNV等位型杂合比最接近0.5的四个点,该四个点依照以下规则选取:以δi衡量SNV等位型杂合比与0.5的接近程度,δi=(Dep(x1)/Dep_total[i]‑0.5)2+(Dep(x2)/Dep_total[i]‑0.5)2;选取δi最小的四个i位置;且该四个位置前后两个位置的Dep(*)小于总深度的20%,否则继续根据δi筛选;根据该四个i位置确定矩阵中每个j位置的连锁相:(4.2.2.1)对于矩阵中该四个杂合位点,第一个杂合位点i位置最大深度Dep(x1)的碱基类型对应的矩阵的j位置为相位1,第二大深度Dep(x2)的碱基类型对应的矩阵的j位置为相位2,确定第一个杂合位点的不需要矫正的j坐标的相位;(4.2.2.2)第二个杂合位点的相位根据第一个杂合位点的每一个j坐标的相位情况确定:若相位1对应的碱基类型有80%为该i位置的最大深度Dep(x1)的碱基类型,且相位2对应的碱基类型有80%为该i位置的第二大深度Dep(x2)的碱基类型,则最大深度Dep(x1)的碱基类型对应的矩阵的j位置为相位1,第二大深度Dep(x2)的碱基类型对应的矩阵的j位置为相位2;若相位1对应的碱基类型有80%为该i位置的最大深度Dep(x2)的碱基类型,且相位2对应的碱基类型有80%为该i位置的最大深度Dep(x1)的碱基类型,则第二大深度Dep(x2)的碱基类型对应的矩阵的j位置为相位1,最大深度Dep(x1)的碱基类型对应的矩阵的j位置为相位2;若满足以上两个条件,则根据该方法确定其它杂合位点的连锁相;若以上两个条件不都满足,继续根据第三个位点分别和第一个杂合位点、第二个杂合位点进行判断;满足(4.2.2.2)所述要求的位点,共同确定连锁相,不满足(4.2.2.2)所述要求的位点被作为纯合位点;第四个i位置,依照此方法,对前面三个点进行验证和对不确定相位的j位置补缺;对于该四个杂合位点,相位1对应的j位置组成数组j(phase1),相位2对应的j位置组成数组j(phase2);以相位1对应的基因型的深度为Dep(phase1),以相位2对应的基因型的深度为Dep(phase2),计算杂合基因型的比例Rh:Rh=Dep(phase1)/[Dep(phase1)+Dep(phase2)];(4.2.3)确定纯合位点与杂合位点;对于每个i位置,满足以下任意一种情况,则为杂合位点:①Dep(x1)对应的碱基j位置至少80%属于数组j(phase1),Dep(x2)对应的碱基j位置至少80%属于数组j(phase2);②Dep(x1)对应的碱基j位置至少80%属于数组j(phase2),Dep(x2)对应的碱基j位置至少80%属于数组j(phase1);否则为纯合位点;根据矩阵中杂合位点j位置的连锁相的判断,对纯合、杂合位点再次验证调整;初步确定该扩增子或基因为纯合单体型还是杂合二倍型;(4.2.4)碱基矫正对于纯合位点,该i位置调整y=Dep(x2);当Dep(x)<=y,则该处ij坐标的碱基被矫正为最大深度Dep(x1)的碱基类型;对于杂合位点,该i位置调整y=Dep(x3);当Dep(x)<=y,则该处ij坐标将根据其连锁相,从而决定该处ij坐标的碱基被矫正为最大深度Dep(x1)的碱基或第二大深度Dep(x2)的碱基;(4.2.5)输出后验矩阵(5)分相得到单体型序列对矫正后的矩阵进行序列读取;根据(4.2.3)确定该扩增子为纯合单体型或杂合二倍型,若为纯合单体型,输出最大深度的一条单体型序列;否则根据(4.2.3)确定的每个j位置的连锁相,对校正后的序列按照相位1和相位2归类;输出最大深度的两条单体型序列,以两条单体型序列深度为单位,和对应(4.2.2.2)中的Dep(phase1)、Dep(phase2)进行卡方检验,确定该扩增子为纯合单体型或杂合二倍型,输出一致性序列;(6)分型判断(6.1)根据比对位置,确定单体型序列的每个外显子编号及对应的碱基序列;对于每条单体型序列,根据外显子匹配度输出完全匹配结果result1,否则输出最佳匹配的6位分型结果result1,同时打印该基因突变或gap处的位置和突变类型,并标记为新的型别,作为result1;(6.2)进一步对单体型全长匹配打分若IPD‑IMGT/HLA数据库中基因全长序列文件hla_gen.fasta,有result1的分型,则将单体型中内含子的序列,与数据库中的参考序列进行匹配打分;给出最佳8位分型结果result2,若突变则同时打印该基因突变或gap处的位置和突变类型,并标记为新的型别result2。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京希望组生物科技有限公司,未经北京希望组生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810191663.4/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top