[发明专利]一种基因型校正的装置和方法有效
申请号: | 201910119729.3 | 申请日: | 2019-02-18 |
公开(公告)号: | CN109785899B | 公开(公告)日: | 2020-01-07 |
发明(设计)人: | 黄铨飞;吕来灰;朱鹏远;王杨 | 申请(专利权)人: | 东莞博奥木华基因科技有限公司 |
主分类号: | G16B5/20 | 分类号: | G16B5/20;G16B20/00 |
代理公司: | 11332 北京品源专利代理有限公司 | 代理人: | 巩克栋 |
地址: | 523808 广东省东莞市东莞松山湖高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因型 后验概率 校正 贝叶斯模型 分布信息 数据建立 统计模型 先验分布 阈值关系 构建 位点 判定 检测 | ||
1.一种基因型校正的装置,其特征在于,所述装置包括如下单元:
(1)样本收集单元:收集不同基因型的初始样本,确定初始样本各位点的基因型;
(2)数据采集单元:对初始样本进行测序和变异分析,采集突变频率;
(3)模型构建单元:采用贝叶斯模型结合核密度估计的方法,根据单元(2)采集的突变频率和单元(1)确定的已知基因型构建贝叶斯模型,制定阈值;
所述贝叶斯模型的公式为:
其中,所述GTi表示为某种基因型事件,AF表示突变频率事件;
所述P(GTi)为先验概率,即在不附加任何条件下发现某种基因型的概率值;
所述条件概率P(GTi|AF)为后验概率,即在观察到AF频率后对应的基因型进行判定的概率值;
所述条件概率P(AF|GTi)为计算过程中的条件概率,即在事件GTi已知的条件下事件AF发生的概率值;
(4)检测校正单元:对待测样本进行测序,采集突变频率,将根据贝叶斯模型结合核密度估计的方法计算得到的后验概率值P(GT|AF)与单元(3)制定的阈值比较,判别校正该位点的基因型。
2.根据权利要求1所述的装置,其特征在于,单元(1)所述基因型包括野生型、纯合突变型或杂合突变型中的任意一种或至少两种的组合。
3.根据权利要求2所述的装置,其特征在于,单元(1)所述基因型包括野生型、纯合突变型和杂合突变型的组合。
4.根据权利要求1所述的装置,其特征在于,单元(1)所述确定的方法为一代测序法。
5.根据权利要求1所述的装置,其特征在于,单元(2)所述测序的方法为半导体测序法。
6.根据权利要求1所述的装置,其特征在于,单元(2)所述突变频率为突变型碱基深度与测序深度的比值。
7.根据权利要求1所述的装置,其特征在于,单元(3)所述条件概率P(AF|GTi)通过核密度估计的方法计算;
所述核密度估计的公式如下:
其中,p(xAF)为概率密度函数,对其积分能够求得P(AF|GTi);
概率N(xi,z)为高斯分布,z为设定参数,称为带宽,n为数据点总数,带宽影响密度估计,反映KDE曲线整体的平坦程度。
8.根据权利要求7所述的装置,其特征在于,所述带宽的选取公式如下:
其中,z为带宽,n为数据点总数,σ为标准差。
9.根据权利要求1所述的装置,其特征在于,单元(4)所述测序为半导体测序。
10.根据权利要求1所述的装置,其特征在于,单元(4)所述校正的判定标准为:满足后验概率P(GT|AF)≥阈值时,则判定为该基因型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞博奥木华基因科技有限公司,未经东莞博奥木华基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910119729.3/1.html,转载请声明来源钻瓜专利网。