[发明专利]单核苷酸多态位点分型算法有效
申请号: | 201510955436.0 | 申请日: | 2015-12-17 |
公开(公告)号: | CN106570350B | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 金力;李士林;王一 | 申请(专利权)人: | 复旦大学 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 上海元一成知识产权代理事务所(普通合伙) 31268 | 代理人: | 吴桂琴 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于生物信息学领域,具体涉及用于从原始测序数据中对单核苷酸多态位点(Single nucleotide polymorphisms,SNP)进行精确分型的算法。该算法基于统计学和群体遗传学原理,可对样本的指定SNP位点进行分型,且对该分型结果进行相应的质量评估。本发明的标准质量分数能精确的评价分型的准确率,且非常容易在实际工作中使用。可进一步作为实际法医学工作中标准化的质量统计量。 | ||
搜索关键词: | 核苷酸 多态位点分型 算法 | ||
【主权项】:
1.一种单核苷酸多态位点分型算法,其特征在于,所述算法是对样本的指定SNP位点进行精确分型的算法,其中,通过构建二项分布统计学模型,对SNP位点的等位基因在人群中的分布进行模拟,从而精确的推测出个体的基因分型;所述的算法包括步骤:(1)建立模型:给定一个SNP位点,分别提取每个样本的两个等位基因的有效乘数EBD:
对于一个群体,第i个个体的参考等位基因(reference allele)与交互等位基因(alternative allele)的EBD分别为ri和ai;对三种可能的基因型RR、RA、AA,假设它们在测序中分别有一个固定的突变等位基因出现率,分别为p(RR)、p(RA)和p(AA);理想情况下p(RR)接近0,p(RA)接近0.5,p(AA)接近1;假设等位基因频率服从哈迪‑温伯格平衡,同时有固定的交互等位基因频率(alternative allele frequency)fre,因此:f(RR)=(1‑fre)2f(RA)=2fre(1‑fre)f(AA)=fre2实际样本由于其基因型未知,认为它是由三种等位基因叠加而成,因此SNP模型具有如下概率模型:
(2)最大似然估计:引入隐变量:w(RR)i、w(RA)i、w(AA)i表述所述个体的三种基因型概率;使用Expectation‑Maximization(EM)算法进行最大似然估计,其E步骤和M步骤分别是:E步骤:
M步骤:![]()
(3)样本基因型确定:对于第i个样本,取w(RR)i、w(RA)i、w(AA)i中最大的基因型作为该样本的基因型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510955436.0/,转载请声明来源钻瓜专利网。
- 上一篇:设备和信息处理方法
- 下一篇:相机模块、电子装置及其操作方法
- 基因分型芯片及其制备方法与应用
- 多态性位点基因型预测血管紧张素转换酶抑制剂类药物作用效果的用途、方法和试剂盒
- 多态性位点基因型预测同型半胱氨酸水平的用途、方法和试剂盒
- 多态性位点基因型预测心脑血管疾病发生及预后的用途、方法和试剂盒
- 一种检测人6种免疫相关基因的标签单核苷酸多态性位点方法
- 一种绵羊KDM3B基因插入/缺失作为繁殖性状早期选择的应用及方法
- 一种绵羊AHR基因插入/缺失作为繁殖性状早期选择的应用方法
- 一种绵羊CRY2基因插入/缺失多态性的检测方法、试剂盒和应用
- 一种绵羊PER2基因插入/缺失多态性的检测方法、试剂盒和应用
- 一种绵羊PDGFD基因插入/缺失多态性的检测方法、试剂盒和应用