[发明专利]SNP致病因素与疾病关联关系模型建立方法有效
申请号: | 201910539328.3 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110459266B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 张军英;朱皓晨 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/20 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 李霞 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | snp 致病 因素 疾病 关联 关系 模型 建立 方法 | ||
本发明属于数据处理技术领域,公开了一种SNP致病因素与疾病关联关系模型建立方法,采集当前SNP致病因素对应的样本数据集;依据初始值对样本数据集进行绝对划分;基于机器学习方法的SNP致病因素与疾病关联关系建模;建模结果准确性评价;确定SNP致病因素与疾病的关联关系模型。本发明通过绝对划分的方法,降低了各个SNP致病因素之间的相互影响程度,使建立的每个SNP致病因素与疾病的关联关系模型更准确。本发明操作简单,只需要输入原始的SNP数据和所有的SNP致病因素,即可得到每个SNP致病因素与疾病的较为准确的关联关系模型。
技术领域
本发明属于数据处理技术领域,尤其涉及一种SNP致病因素与疾病关联关系模型建立方法。
背景技术
目前,最接近的现有技术:
SNP:单核苷酸多态性(SingleNucleotidePolymorphisms),是指在基因组上由单个核苷酸(A,T,C,G)变异所引起的多态性。越来越多的研究证据表明SNP与疾病有着密切的关系,而这种关联关系正是理解疾病产生原因、进行医疗预防及诊断的基础。深入了解SNP与疾病之间的关联关系能够为理解疾病的致病机理提供可能性,也能够在治疗和战胜复杂疾病的道路上更进一步。
可将SNP与疾病关联关系的研究分为两类:SNP级和SNP因素级。SNP级关联关系研究,是对从基因组数据中找出的与疾病表型关联的SNP子集,建立这些SNP与疾病表型的关联关系模型。SNP因素级关联关系研究,则是通过从基因组数据中找出的与疾病表型相关的所有SNP致病因素,建立其中每一个SNP致病因素与疾病表型的关联关系。前者是建立的是一个SNP子集与疾病表型的关联关系,后者则是针对多个SNP子集中的每一个,建立其与疾病表型的关联关系。目前SNP级研究非常广泛,而SNP因素级研究极其有限。
在SNP级关联关系上目前的做法是:训练一个分类器,分类器的结构和参数就给出了这个SNP子集与疾病表型的关联关系。各类分类器都有在这个问题上的应用,包括多层感知器网络、决策树、支持向量机、随机森林等等。
在SNP因素级关联关系问题上,目前技术非常有限,典型的是通过多层感知器(MLP)来实现。
基于MLP的SNP致病因素与疾病关联关系建模方法,其基本思路是为每一个SNP致病因素分别建立MLP神经网络,步骤如下:
1)建立MLP神经网络,随机初始化网络连接的权值,并设定相关参数;
2)输入样本数据(包括SNP数据及对应类别);
3)迭代训练网络,直到网络收敛稳定;
4)用SNP致病因素的各种SNP状态组合作为测试数据输入网络,网络的输出即为对应组合分类为有病的后验概率。
SNP致病因素对疾病的影响方式和影响程度不明确。虽然已有的方法能够建立出SNP致病因素与疾病关联关系模型,但其所建立模型的准确性并不能达到预期,因此还需要进一步探索更好的方法和技术。
综上所述,现有技术存在的问题是:
SNP致病因素对疾病的影响方式和影响程度不明确。
解决上述技术问题的难度:
1.现有的方法所建立的模型准确率低;
2.SNP数据具有小样本特性,样本量少使建模难度高、准确率受影响;
3.某种特定疾病下往往其致病因素的个数不仅仅是一个,每个致病因素与疾病表型的关联关系是不同的,且是非确定的。
解决上述技术问题的意义:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910539328.3/2.html,转载请声明来源钻瓜专利网。