[发明专利]多任务高阶SNP上位检测方法、系统、存储介质、设备在审
申请号: | 202011315829.2 | 申请日: | 2020-11-22 |
公开(公告)号: | CN112447263A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 拓守恒;刘凡;李超 | 申请(专利权)人: | 西安邮电大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B50/00 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710061 陕西省西安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务 snp 上位 检测 方法 系统 存储 介质 设备 | ||
1.一种多任务高阶SNP上位检测方法,其特征在于,所述多任务高阶SNP上位检测方法包括:
利用Plink软件从VCF文件中读取出PED,MAP格式数据,转换位二进制格式文件整理成样本矩阵;
根据数据中SNP位点和样本量的大小,设置搜索算法参数;
将SNP样本数据读入,开始准备第一阶段搜索;
利用多任务、多和声记忆库和声搜索算法进行高阶SNP上位组合检测。
2.如权利要求1所述的多任务高阶SNP上位检测方法,其特征在于,所述利用Plink软件从VCF文件中读取出PED,MAP格式数据,进一步转换位二进制格式文件FAM,BED,BIM整理成样本矩阵。
3.如权利要求1所述的多任务高阶SNP上位检测方法,其特征在于,所述根据数据中SNP位点和样本量的大小,设置和声搜索算法参数.有最大进化代数MaxT,和声记忆库大小HMS(harmony memory size),和声记忆库考虑概率HMCR(harmony memory considerationrate),局部微调概率PAR(pitch adjusting rate)。
4.如权利要求1所述的多任务高阶SNP上位检测方法,其特征在于,所述多任务高阶SNP上位检测方法的和声搜索算法是元启发式搜索算法,对于多任务高阶SNP上位检测问题,表示为如下组合优化问题:
其中X表示k个SNP的组合,该优化问题的目标是从基因组中找出与疾病状态Y具有最强关联性的SNP上位组合X*。
5.如权利要求1所述的多任务高阶SNP上位检测方法,其特征在于,所述多任务高阶SNP上位检测方法采用的的多任务和声搜索算法的目标是从基因组中发现多个不同阶数的SNP上位组合,数学模型表示为:
其中,Xi表示一个ki(=2)阶的SNP组合,该问题的目标是从基因组中发现与疾病状态具有最强关联性的k1阶,k2阶,,…,kM阶(k1-order,k2-order,,…,kM-order)的SNP上位组合X1*,X2*,…,XM*。
6.如权利要求1所述的多任务高阶SNP上位检测方法,其特征在于,所述多任务高阶SNP上位检测方法每个任务对应一个独立的和声记忆库HM(harmony memory),分别采用各自的选择机制进行优胜劣汰;在搜索过程中,每次迭代,为每一个任务生成一个新个体;新个体的产生通过两种方式生成:群内学习生成,群体间组合交叉学习生成;
多任务和声搜索方法的每个任务可以采用相同类型的关联性评价函数,也可以采用不同类型的关联性评价函数,甚至每个和声记忆库中的个体可以采用多个不同类型的评价函数;
采用的统一编码机制:多个任务采用了统一的编码,采用统一的搜索空间进行搜索,在进行k-order(k阶)任务的关联性评价时,从编码的左侧开始读取,连续选择k位编码作为该任务的一个个体编码。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
利用Plink软件从VCF文件中读取出PED,MAP格式数据,转换位二进制格式文件整理成样本矩阵;
根据数据中SNP位点和样本量的大小,设置搜索算法参数;
将SNP样本数据读入,开始准备第一阶段搜索;
利用多任务、多和声记忆库和声搜索算法进行多个不同阶数的高阶SNP上位组合的检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011315829.2/1.html,转载请声明来源钻瓜专利网。