[发明专利]使用NGS数据预测基因型的方法及装置在审
申请号: | 202080052996.4 | 申请日: | 2020-05-22 |
公开(公告)号: | CN114175170A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 韩凡 | 申请(专利权)人: | 首尔大学校产学协力团 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/20;G16B25/10 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陈金林 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 ngs 数据 预测 基因型 方法 装置 | ||
本发明涉及一种使用下一代测序(NGS)数据预测基因型的方法及装置。一实施例包括以下步骤:获取分析对象的NGS数据;应用基于NGS的预测技术来获取第一概率;应用基于SNP的预测技术来获取第二概率;以及基于第一概率及第二概率来预测分析对象的NGS数据中的基因型。
技术领域
以下实施例涉及一种使用NGS数据预测基因型的方法。
背景技术
存在于包括人类在内的生物体细胞染色体中的DNA是一种遗传物质,在生殖和繁殖过程中传递给后代。在人类的情况下,从父母双方继承的DNA形成成对的染色体。与表型表达有关的DNA碱基序列的一部分称为基因,而蛋白质由基因表达合成,形成生物体的结构和功能。由于基因的DNA碱基序列的差异,每个生物体都被确定为不同的基因型,因此,属于同一物种的个体的DNA碱基序列中存在互不相同的单个碱基。将由DNA碱基序列中的单个碱基差异引起的遗传多样性称为单核苷酸多态性(SNP,single nucleotide polymorphism)。
下一代测序(NGS,Next Generation Sequencing)技术是一种将生物体的DNA或RNA切成小块,使用机器读取其序列的技术。为了确定每个序列片段在基因组(genome)中的位置,执行映射(mapping)任务,并在找到所有序列片段的位置后,通过分析DNA是否被修饰或测量转录成RNA的DNA量等来执行各种分析。为了映射特定生物体的遗传物质序列片段,需要作为相应生物基因组标准的参考基因组(reference genome),并通过人类基因组计划(Human Genome Project)等项目建立人类参考基因组,以不断更新。
然而,在多态(polymorphic)基因的情况下,即,在可能具有各种基因型的基因(例如,HLA)的情况下,特定生物体的序列片段可能具有与参考非常不同的序列,因此难以通过从NGS数据映射到参考基因组来精确分型基因型。为了解决难以将具有高度多态性的基因的序列片段映射到参考基因组的问题,人们使用一种方法:将序列片段映射到存储有各种已知基因型及其序列信息的数据库的整个序列,而不是只映射到一个参考基因组。例如,在人类HLA基因的情况下,在称为IMGT/HLA的公共数据库中,存储有迄今已知的各种HLA基因型及其序列信息。然而,上述方法存在一个问题,即当NGS深度(depth)较低时,准确度明显降低,因此需要开发一种改进的技术,其即使在NGS深度较低的情况下也能够准确预测基因型。
发明内容
要解决的技术问题
实施例提供一种技术,其即使NGS数据的测序深度较低,也能够从NGS数据精确分析具有高度多态性的基因的基因型。
实施例公开一种准确预测HLA基因的基因型的技术,其可用于确定反向化疗、自身免疫疾病风险、器官移植适宜性及药物副作用等。
解决问题的技术方法
根据一侧的使用下一代测序(NGS)数据预测基因型的方法,包括以下步骤:获取分析对象的NGS(next generation sequencing)数据;将所述分析对象的NGS数据分别映射(mapping)到针对分析对象基因具有不同基因型的每个碱基序列;基于所述映射结果,获取所述分析对象的NGS数据与针对所述分析对象基因的每个基因型对应的第一概率;从所述NGS数据中提取分析对象的SNP数据;获取参考数据,所述参考数据包括针对所述分析对象基因具有不同基因型的多个SNP数据;基于所述分析对象的SNP数据及所述参考数据,获取所述分析对象的SNP数据对应于所述多个基因型中的每一个的第二概率;以及基于所述第一概率及所述第二概率,预测所述分析对象的NGS数据的基因型。
获取所述第一概率的步骤,可以包括以下步骤:对于针对所述分析对象基因具有不同基因型的每个碱基序列,获取所述NGS数据中映射的碱基序列的长度;以及基于所述映射的碱基序列的长度,获取与针对所述分析对象基因的每个基因型对应的第一概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首尔大学校产学协力团,未经首尔大学校产学协力团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080052996.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置