[发明专利]多任务高阶SNP上位检测方法、系统、存储介质、设备在审
申请号: | 202011315829.2 | 申请日: | 2020-11-22 |
公开(公告)号: | CN112447263A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 拓守恒;刘凡;李超 | 申请(专利权)人: | 西安邮电大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B50/00 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710061 陕西省西安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务 snp 上位 检测 方法 系统 存储 介质 设备 | ||
本发明属于单核苷酸多态性上位检测技术领域,公开了一种多任务高阶SNP(single nucleotide polymorphism)上位检测方法、系统、存储介质、设备,所述多任务高阶SNP上位检测方法利用Plink软件从VCF文件中读取出PED,MAP格式数据,转换位二进制格式文件整理成样本矩阵;根据数据中SNP位点和样本量的大小,设置搜索算法参数;将SNP样本数据读入,开始准备第一阶段搜索;利用多任务、多和声记忆库和声搜索(harmony Search,HS)算法进行高阶SNP上位组合检测。本发明提出一种多任务和声搜索检测方法,采用多个和声记忆库,分别存放不同阶的SNP组合,多任务技术的运用,可以同时进行多个不同阶数的高阶SNP上位探测,促进种群内个体之间的相互学习,增强种群的多样性,进而提升全局搜索能力。
技术领域
本发明属于单核苷酸多态性上位检测技术领域,尤其涉及一种多任务高阶SNP上位检测方法、系统、存储介质、设备。
背景技术
目前:单核苷酸多态(Single Nucleotide Polymorphism,SNP)是指在基因组水平上单个碱基位点变异引起的多态性,可能是单个碱基的转换(transition)或颠换(transversion),也可能是由于碱基的插入或缺失所致。在序列1中的一个碱基对C-G在序列2中表现为A-T,该位点就被称为1个SNP位点。在人类全基因组上,这样的SNP位点超过300万个,通常情况下,绝大部分SNP不会给人类的健康带来威胁,但是,有些SNP变异位点与人类的健康密切关联。上位效应(epistatic effect):表示一个基因或SNP之间的相互作用,传统定义为一个位点上的等位基因掩盖了另一个等位基因表型的表达。对于多个SNP之间的上位效应是指多个SNP联合作用于表型的表达,对于复杂疾病来说,可能是受到多个SNP联合作用的影响,如果某个人在这几个位点上同时出现了SNP变异,其得病的概率会明显升高。k阶SNP上位(表示为k-order SNP上位组合)是由k个SNP联合作用于表型(或疾病状态)的上位组合。对于k2的多任务高阶SNP上位检测是非常复杂的“SNP组合爆炸”问题,计算量巨大,现有计算机无法在有效时间内完成全基因组的上位组合检测。目前,虽然已经提出大量方法用于多任务高阶SNP上位检测,如穷举法、并行计算法、蒙特卡洛方法等,但依然存在搜索代价大,检测能力低下的问题。
现有的多任务高阶SNP上位检测技术基本都是一次只能完成某一阶数(如3阶)的SNP上位检测。需要通过多次试探性运行,才能完成不同阶数(2阶,3阶,…,k阶)的SNP上位检测。运行代价很大。
现有技术通过单个SNP与疾病状态进行关联性分析,已经发现了很多易感基因,然而,其对复杂疾病的解释性并不是很好。因此,生物界普遍认为“高阶SNP上位组合是可能形成复杂疾病的重要原因”,但是,由于高阶SNP组合的数量极大,是非常复杂的“组合爆炸问题”,现有计算机难以检测所有可能的SNP组合,这成为现有技术遇到的最重大挑战之一。另外,精准鉴别高阶SNP组合是否具有上位效应也是一个重要且复杂的研究课题,现有方法往往存在对SNP上位模型的偏好性,难以适用于所有上位模型的判断。
目前,针对高阶SNP上位的检测方法,主要有两个难题需要克服:从高维的搜索空间中,搜索出可能致病的SNP上位组合,这是一个“组合爆炸问题”,另外,由于对复杂疾病的致病机理未知,可能的SNP上位模型多种多样,如何能够正确鉴别致病的高阶SNP组合,也是一个巨大挑战。
现有技术从“搜索”的角度可以分为以下几种:
1.Exhaustive Search(穷举搜索);通过枚举所有k-order(k个SNP的组合)SNP,采用某一方法对其进行关联性评价。优点是不会漏判某一可能的致病SNP组合,缺点是计算量极大,当k3时,无法在有效时间内完成计算。
2.Stochastic search(随机搜索);采用随机抽样的思想在解空间进行搜索,能够大幅降低计算量,但成功率较低,偏好于具有边际效应的SNP上位组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011315829.2/2.html,转载请声明来源钻瓜专利网。