[发明专利]基于神经网络的基因突变致病性检测方法、系统及介质有效
申请号: | 201911303581.5 | 申请日: | 2019-12-17 |
公开(公告)号: | CN111063392B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 蒋艳凰;赵强利;李根;余硕军;雷鹏;张少伟;万斌;贺依依 | 申请(专利权)人: | 人和未来生物科技(长沙)有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 邹大坚 |
地址: | 410000 湖南省长沙市长沙高*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 基因突变 致病性 检测 方法 系统 介质 | ||
1.一种基于神经网络的基因突变致病性检测方法,其特征在于实施步骤包括:
1)输入待检测的基因检测VCF文件以及HPO表型;
2)根据待检测的基因检测VCF文件以及HPO表型获取各个基因变异的特征值;各个基因变异的特征值包括:用于变异有无Clinvar结果的特征;用于表示用户输入表型和当前变异基因对应表型的匹配度的特征GeneHPO;用于表示当前变异基因在OMIM数据库中是否有对应疾病的特征InOmim;用于表示当前变异基因在OMIM疾病库中对应疾病的HPO和用户输入的HPO是否相匹配的特征OmimHPO;用于表示当前基因变异在多种人群数据库中出现的最大频率的特征MaxMAF;用于表示蛋白质功能预测软件SIFT的预测结果的特征SIFT;用于表示蛋白质功能预测软件PolyPhen2预测结果的特征PolyPhen2;用于表示蛋白质功能预测软件MutationTaster预测结果的特征MTaster;用于表示保守性预测软件GERP++_RS结果的特征EvoRate;用于表示当前基因变异是否位于蛋白质功能区域的特征Domain;用于表示当前基因变异是否位于重复区域的特征RMSK;用于表示当前变异的接合性与相应基因对应疾病的遗传性是否一致的特征Inherit;
3)对于每一种基因变异,将该基因变异的特征值输入训练好的神经网络模型得到该基因变异的致病性综合分析结果,所述神经网络模型被预先训练建立了各个基因变异的特征值、各个基因变异的致病性综合分析结果之间的映射关系;
4)按照致病性综合分析结果从高到低进行排序,确定每个基因变异的致病性优先级,按优先级顺序输出每个基因变异及其致病性综合分析结果。
2.根据权利要求1所述的基于神经网络的基因突变致病性检测方法,其特征在于,步骤3)中的神经网络模型为BP神经网络。
3.根据权利要求2所述的基于神经网络的基因突变致病性检测方法,其特征在于,所述BP神经网络为包括输入层、中间层以及输出层的三层结构,其中输入层节点数目与样本的特征数目相同,中间层节点数目大于输入层节点数目,输出层仅有一个节点。
4.根据权利要求1所述的基于神经网络的基因突变致病性检测方法,其特征在于,步骤3)之前还包括训练神经网络模型的步骤,详细步骤包括:
S1)产生训练样本:(1)获取若干基因检测VCF文件、每个基因检测VCF文件对应的HPO表型和已知的致病基因;(2)获取基因突变的特征值:根据每个基因检测VCF文件以及HPO表型获取各个基因突变的特征值;(3)确定致病基因突变样本:对于每个基因检测VCF文件中致病基因所对应的所有突变,计算它们的突变注释评分P_Score值,取突变注释评分P_Score值最大的突变为致病基因突变,该基因突变为一个训练样本,并令其致病性综合分析值为第一标签值;(4)确定非致病基因突变样本:对于每个基因检测VCF文件,随机选取指定数量个非致病基因突变作为训练样本,并令其致病性综合分析值为第二标签值;
S2)训练神经网络模型:利用训练样本集完成神经网络模型的训练,使得神经网络模型被建立各个基因变异的特征值、各个基因变异的致病性综合分析结果之间的映射关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人和未来生物科技(长沙)有限公司,未经人和未来生物科技(长沙)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911303581.5/1.html,转载请声明来源钻瓜专利网。