[发明专利]一种基于遗传性基因突变预测癌症风险的方法有效
申请号: | 201911063276.3 | 申请日: | 2019-11-04 |
公开(公告)号: | CN110890131B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 李嘉路;华芮;杨安力;刘洪 | 申请(专利权)人: | 深圳市华嘉生物智能科技有限公司 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B20/30;G16H50/30;G16H50/70 |
代理公司: | 深圳市精英创新知识产权代理有限公司 44740 | 代理人: | 黄文锋 |
地址: | 518067 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 遗传性 基因突变 预测 癌症 风险 方法 | ||
1.一种基于遗传性基因突变预测癌症风险的方法,其特征在于,包括:
使用分子生物学实验技术从唾液样本中检测关键基因位点的遗传性突变信息;
使用家族数据校正确认偏差,并分析家族内部的残余相关性;
使用重复事件生存分析模型拟合多重原发癌症随访数据;
使用蒙特卡洛马尔可夫链的贝叶斯方法估测模型中值域为实数的参数;
使用模拟实验方法、交叉验证患者数据、独立验证患者数据、以及5年内原发癌症患发预测的标准,验证模型的功效;
整合以家庭为单位的确认偏差校正的统计学方法,公式如下:
其中,Pr表示似然函数;代表第i个家庭的经确认偏差校正的似然值;hi表示第i个家族所有家族成员的的癌症病史;gi表示第i个家庭里与基因型相关的协变量;obs表示观测值;表示第i个家庭里与基因型无关的协变量;θ是待估测参数;ξi表示第i个家庭的随机效应;Ai表示第i个家庭的确定指标变量;是此家庭被确认偏差式选中的概率;
其中,残余相关性包括生活习惯因素和饮食习惯因素。
2.根据权利要求1所述的方法,其特征在于,还包括:采集人唾液样本,室温下保存七日内提取核酸,使用位点特异性引物进行PCR扩增并测序,基于突变位点的等位基因频率确定测试者是否携带此位点的遗传性突变。
3.根据权利要求1所述的方法,其特征在于,所述使用重复事件生存分析模型拟合多重原发癌症随访数据包括:通过整合第二次癌症患发信息提高第一次癌症风险预测的统计学效力,对于第i个家庭里的第j个患者来说,其条件似然定义为:
其中,Lij(θ,ξ)表示第i个家庭里的第j个患者的似然函数;θ是待估测参数;ξ表示随机效应;Kij表示第i个家庭里的第j个患者的总共观察到的原发癌症数量;λ表示条件强度函数;tij,k表示第i个家庭里的第j个患者的k个原发癌症的发病时间;xij表示第i个家庭里的第j个患者的协变量向量;ξi是第i个家庭的随机效应,代表此家庭内部的残余相关性;tij,k-1表示第i个家庭里的第j个患者的k-1个原发癌症的发病时间;u表示此段发病时间的均值;表示第i个家庭里的第j个患者的第k个原发癌症的发病时间;vij表示第i个家庭里的第j个患者的删失时间;设ξ1,…,ξI~Gamma(φ,φ),ξ1表示第1个家庭的随机效应,ξI表示第I个家庭的随机效应,Gamma表示伽马分布,φ表示随机效应的超参数;癌症风险值由以下公式计算得出:
其中,Pr表示似然函数;W1表示第1个原发癌症的序列间隙时间;w表示序列间隙时间;X(t)表示发病时间的协变量向量;X(u)表示该段发病时间均值的协变量向量。
4.根据权利要求1所述的方法,其特征在于,所述使用蒙特卡洛马尔可夫链的贝叶斯方法估测模型中值域为实数的参数包括:使用蒙特卡洛马尔可夫链的贝叶斯方法估测模型参数,对于值域为正数的参数,使用对数正态分布作为抽样分布,设γ(t-1)∈(0,+∞)~lnN(μ,σ),γ表示贝叶斯方法估测模型参数;t表示迭代次数;lnN(μ,σ)表示正态分布;抽出的一个新的样本γ*=exp(lnγ(t-1))∈(0,+∞),抽样概率分布不对称性由以下权重校正:
5.根据权利要求1所述的方法,其特征在于,还包括:使用模拟实验数据验证模型拟合的可靠性;使用实际原发癌症患者数据验证模型的预测准确度,所预测的是5年内第一次原发癌症的患发。
6.根据权利要求1所述的方法,其特征在于:所述方法包括应用于相关基础实验或临床试验的数据分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华嘉生物智能科技有限公司,未经深圳市华嘉生物智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911063276.3/1.html,转载请声明来源钻瓜专利网。