[发明专利]一种多基因分子诊断模型、其构建方法及应用在审
申请号: | 202010857975.1 | 申请日: | 2020-08-24 |
公开(公告)号: | CN112002417A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 周家秀;林飞飞;王明帮;林鄞 | 申请(专利权)人: | 深圳市儿童医院 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G16B20/50;G16B20/20;G16B40/00;C12Q1/6883 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 李于明 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多基因 分子 诊断 模型 构建 方法 应用 | ||
1.一种孤独症谱系障碍的多基因分子诊断模型的构建方法,其特征在于,包括:
征集发现阶段和验证阶段的研究对象,所述研究对象为健康人和孤独症谱系障碍患者;
在所述发现阶段,统计获得所述健康人和所述孤独症谱系障碍患者之间存在显著差异的突变位点;
在所述验证阶段,统计获得所述健康人和所述孤独症谱系障碍患者之间存在显著差异的突变位点;
基于在所述发现阶段和所述验证阶段均存在显著差异的突变位点,构建机器学习模型;所述机器学习模型为分类器。
2.根据权利要求1所述的构建方法,其特征在于,所述统计获得所述健康人和所述孤独症谱系障碍患者之间存在显著差异的突变位点,具体包括:
提取研究对象的DNA样本;
通过所述DNA样本,建立小片段测序文库;
基于所述小片段测序文库,捕获目标基因以建立目标区域捕获文库;
对构建完毕的目标区域捕获文库进行高通量测序,获得测序结果;
对所述测序结果进行变异检测;
统计分析所述变异检测结果中,存在显著差异的突变位点。
3.根据权利要求2所述的构建方法,其特征在于,所述健康人作为健康对照组,所述孤独症谱系障碍患者作为患者组;所述统计分析所述变异检测结果中,存在显著差异的突变位点,具体包括:
计算健康对照组和患者组中携带的稀有突变位点,所述稀有突变位点包括杂合突变和纯合突变;
使用费舍尔检测计算所述稀有突变位点的P值,并且使用FDR校正;
根据所述FDR校正结果,确定存在显著差异的突变位点。
4.根据权利要求1所述的构建方法,其特征在于,所述机器学习模型为随机森林模型,模型条件为所述显著差异的突变位点,模型结果为是否为孤独症谱系障碍患者。
5.根据权利要求2所述的构建方法,其特征在于,所述基于在所述发现阶段和所述验证阶段均存在显著差异的突变位点,构建机器学习模型,具体包括:
使用所述发现阶段的数据,通过K-折交叉验证选定目标的模型参数;
以所述发现阶段的数据作为训练数据,训练获得对应的分类器;
通过所述验证阶段的数据,验证所述训练获得的分类器。
6.根据权利要求5所述的构建方法,其特征在于,所述K-折交叉验证为6折交叉验证。
7.根据权利要求5所述的构建方法,其特征在于,所述方法还包括:
计算所述多基因分子诊断模型的ROC曲线和AUC值。
8.根据权利要求1所述的构建方法,其特征在于,所述显著差异的突变位点包括如下4个稀有的功能性突变:
LILRB2基因的错义突变p.R322H;
LILRB2基因的剪接突变c.956-4CT;
HLA-DQB1基因的错义突变p.S229N;
HLA-B基因的错义突变p.A93G。
9.一种多基因分子诊断模型,其特征在于,所述多基因分子诊断模型通过如权利要求1-8任一项所述的构建方法构建获得。
10.如权利要求9所述的多基因分子诊断模型在孤独症谱系障碍临床遗传学评估工具中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市儿童医院,未经深圳市儿童医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010857975.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种金属加工用加工液体冷却装置
- 下一篇:一种轴承内圈的拆解方法