[发明专利]基因组品种构成的估计方法、装置及电子设备有效
申请号: | 201910064759.9 | 申请日: | 2019-01-23 |
公开(公告)号: | CN109817281B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 何俊;吴晓林 | 申请(专利权)人: | 湖南农业大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 李佳 |
地址: | 410000 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因组 品种 构成 估计 方法 装置 电子设备 | ||
1.一种基因组品种构成的估计方法,其特征在于,所述方法包括:
确定参考群体信息,并获取待估计个体信息;
对所述参考群体中的各参考品种以及所述待估计个体利用基因芯片进行基因组测序以得到基因型数据;
根据所述基因型数据计算得到所述参考群体中每个SNP的等位基因频率,以及所述待估计个体的等位基因计数;
根据所述SNP的等位基因频率以及所述等位基因计数,并构建改进的线性回归模型,以得到根据所述改进的线性回归模型所获得的所述参考群体中各参考品种对于所述待估计个体的基因组品种构成;
所述根据所述SNP的等位基因频率以及所述等位基因计数,并构建改进的线性回归模型,以得到根据所述改进的线性回归模型所获得的所述参考群体中各参考品种对于所述待估计个体的基因组品种构成的步骤,包括:
根据所述SNP的等位基因频率以及所述等位基因计数构建包含所述等位基因频率和所述待估计个体所有的SNP的基因型向量之间的关系的第一方程;对所述第一方程进行约束处理,以得到改进的线性回归模型;基于所述改进的线性回归模型得到所述参考群体中各参考品种对于所述待估计个体的基因组品种构成;
所述对所述第一方程进行约束处理,以得到改进的线性回归模型的步骤,包括:
对所述第一方程进行调整和约束处理以使所述待估计个体的基因组品种构成之和为1,以得到第二方程;对所述第二方程中的回归系数进行条件约束处理,以使所述第二方程中的所有回归系数之和为1,以得到改进的线性回归模型;
构建所述第一方程的步骤包括:
根据所述SNP的等位基因频率以及所述等位基因计数按如下公式构建包含所述等位基因频率和所述待估计个体所有的SNP的基因组向量之间的第一方程:
其中,F={fkj}为大小为M×T的矩阵,M表示SNP的数量,T表示参考群体中参考品种的个数,fkj表示基因芯片数据中第k个SNP在第j个参考品种中的等位基因频率,g表示所述待估计个体所有M个SNP的基因型向量,μ表示总体均数(即期望值),b表示T×1的品种回归系数向量,e表示误差项,1表示单位矩阵;
得到所述第二方程的步骤包括:
针对所述第一方程中的各组成项,利用各所述组成项减去对应组成项的期望值;
将各所述组成项除以所述待估计个体对应的基因型向量的标准差以得到如下的使所述待估计个体的基因组品种构成之和为1的第二方程:
其中,E(μ)=μ,E(e)=0,
对所述第二方程进行简化处理,得到简化后的第二方程:
设并带入所述简化后的第二方程以得到:
其中,为回归系数;
得到改进的线性回归模型的步骤,包括:
对所述第二方程中的回归系数按如下方式进行条件约束处理:
根据条件约束处理后的回归系数得到如下的改进的线性回归模型:
其中,w=y-xM,zj=xj-xM,cj表示第j个参考品种对于所述待估计个体的基因组品种构成。
2.根据权利要求1所述的基因组品种构成的估计方法,其特征在于,所述方法还包括:
根据所述SNP的等位基因频率以及所述等位基因计数,并构建传统的线性回归模型,以得到根据所述传统的线性回归模型所获得的所述参考群体中各参考品种对于所述待估计个体的基因组品种构成;
将根据所述改进的线性回归模型得到的基因组品种构成和根据所述传统的线性回归模型得到的基因组品种构成进行比较,并结合预存的系谱资料以验证所述改进的线性回归模型的计算准确率,其中,所述系谱资料中记录有所述待估计个体的基因组品种构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南农业大学,未经湖南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910064759.9/1.html,转载请声明来源钻瓜专利网。