[发明专利]基于生物信息的选育良种系统及其算法在审

专利信息
申请号: 201611022901.6 申请日: 2016-11-18
公开(公告)号: CN106779076A 公开(公告)日: 2017-05-31
发明(设计)人: 栾图 申请(专利权)人: 栾图;尹聪;梅森
主分类号: G06N3/12 分类号: G06N3/12;G06F19/10
代理公司: 暂无信息 代理人: 暂无信息
地址: 201204 上海市浦东*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 生物 信息 选育 良种 系统 及其 算法
【权利要求书】:

1.一种基于生物信息的选育良种系统,其特征在于,具体实施步骤如下:

一、采用全基因组选择方法,首先获取参考群体和候选群体个体的基因组数据,其中,采用SNP遗传标记来获取基因型数据;

二、获取系谱文件并进行预处理,向上追溯父母系谱信息至少5代及以上,系谱文件需要包含个体编号、父亲编号和母亲编号至少三段信息,在系谱文件中筛选具有基因型数据的基因分型个体,向上追溯父母系谱信息至少5代及以上以获得GA系谱;通过基因分型个体的基因型数据信息对系谱文件中父母及后代亲缘关系进行亲子鉴定以核查GA系谱文件,当根据基因型数据获得的亲子鉴定结果与原始GA系谱文件所显示的亲子关系不一致时,应以基因型数据获得的亲子鉴定结果为基准重新编排原始GA系谱文件;

三、在完成基因型数据的预处理并得到了GA系谱文件后,通过LDMIP方法来完成,具体的LDMIP方法,如下:

A、GA系谱中未基因分型的祖先个体,推知其基因型数据;

B、根据基因型数据和GA系谱信息,计算个体等位基因从父母处遗传的遗传几率;

C、通过LDMIP程序的计算结果可以建立起GA系谱中参考群体和候选群体之间的LDLA关系矩阵,这一关系矩阵既包括参考群体和候选群体之间基于基因型信息的个体亲缘关系,又包括参考群体和候选群体之间基于系谱信息的血缘关系,得到LDLA关系矩阵之后,对其求逆,然后通过混合模型方程组求解候选群体个体的全基因组育种值;

D、同时利用个体等位基因从父母处遗传的遗传几率计算可以示踪等位基因在系谱中世代传递信息,如可以用于检测和确定与疾病相关的功能基因,有助于选育抗病能力强的个体。

2.根据权利要求1所述的一种基于生物信息的选育良种系统,其特征在于,采用SNP遗传标记来获取基因型数据具体方式如下:通过SNP芯片获取参考群体和候选群体的基因型数据并进行预处理,首先基因分型个体的基因型数据如有缺失,对所缺失的基因型予以填充;然后通过SNP标记检出率、最小等位基因频率、Hardy-Weinberg平衡检验、个体检出率等参数优化数据质量。

3.权利要求1所述的一种基于生物信息的选育良种系统的算法,其特征在于,对于基因型数据的每个SNP位点的两个等位基因用0、1进行编码从而得到每个个体的每个SNP位点基因型编码,其中,如第i个个体的第j个SNP位点的编码gij,则对于纯合子“00”的基因型编码为“0”;对于纯合子“11”编码为“2”;对于杂合子“10”或“01”编码为“1”;然后通过LDMIP程序根据GA系谱首先预测祖先个体基因型编码信息,然后计算每个基因座位的等位基因从父母处遗传的遗传几率,利用等位基因遗传几率可以得到连锁分析信息,通过LDMIP程序还可以同时得到连锁不平衡信息,与连锁分析信息共同组建GLDLA关系矩阵,其中,GLDLA关系矩阵的行数和列数相同,均为GA系谱中个体的数目。

4.根据权利要求3所述的一种基于生物信息的选育良种系统的算法,其特征在于,构建GLDLA关系矩阵要涉及到构建基于系谱信息的血缘关系矩阵-A矩阵,和基于SNP信息的亲缘关系矩阵-G矩阵,构建A矩阵的元素依据以下规则来递推确定,即对于系谱中一个体i和它的父亲s和母亲d,其与系谱中另一个体j的关系为:

一、如果它的父亲和母亲都已知,则

aij=aji=0.5(ajs+ajd)

aii=1+0.5(asd);

二、如果它的父亲s已知,母亲d未知,则

aij=aji=0.5(ajs)

aii=1;

三、如果它的母亲d已知,父亲s未知,则

aij=aji=0.5(ajd)

aii=1;

四、如果它的父亲和母亲都未知,则

aij=aji=0

aii=1;

G矩阵的构建依据如下方法:

其中Nm为SNP位点数目,对于个体i和个体j,X中的元素Xij由以下方法确定:

其中gij为前述第i个个体的第j个SNP位点的基因型编码,pj为第j个SNP位点的第一个等位基因的基因频率,通过基因型数据样本计算得出;

在A矩阵和G矩阵都构建好之后,利用如下方法构建GLDLA关系矩阵:

GLDLA=D*A*D+Δ*G*Δ;

而D和Δ分别是两个对角矩阵,其中D矩阵的对角元;

Δ矩阵的对角元

通过GLDLA关系矩阵,对其求逆,利用逆矩阵以及参考群体个体的表型数据可以建立如下混合模型方程组,

其中λ=σe2a2,通过迭代求解混合模型方程组即可预测候选群体个体的全基因组育种值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于栾图;尹聪;梅森,未经栾图;尹聪;梅森许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611022901.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top