[发明专利]基于网络平台的全基因组选择育种值无偏估计工具GS1.0在审
申请号: | 201810143549.4 | 申请日: | 2018-02-12 |
公开(公告)号: | CN108388765A | 公开(公告)日: | 2018-08-10 |
发明(设计)人: | 郑天清;徐建龙;黎志康;崔艳茹;徐世忠;王春超;陈凯 | 申请(专利权)人: | 中国农业科学院作物科学研究所;中国农业科学院深圳生物育种创新研究院;中国农业科学院深圳农业基因组研究所 |
主分类号: | G06F19/12 | 分类号: | G06F19/12;G06F19/18;G06F19/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 无偏估计 全基因组 分析工具 网络平台 选择育种 育种 数据库网站 分子育种 育种进程 远程分析 整合 创建 撰写 应用 开放 服务 | ||
本发明涉及一种利用基于网络平台的全基因组选择育种值无偏估计工具GS1.0的创建及运用其进行全基因组选择中育种值无偏估计的方法。将BLUP与REML的方法结合,利用R撰写可供Linux环境下运行的无偏估计工具GS1.0,并整合到数据库网站平台,方便用户远程分析使用;所创建的育种值无偏估计分析工具GS1.0完全免费,开放友好,能够为更多的育种工作者服务,加快育种进程。该分析工具主要应用于作物基于全基因组选择的分子育种。
技术领域
本发明涉及一种利用基于网络平台的全基因组选择育种值无偏估计工具GS1.0的创建及运用其进行全基因组选择中育种值无偏估计的方法。该方法及其创建的基于互联网平台的全基因组选择育种值无偏估计分析工具GS1.0,属于作物分子育种领域,适用于在以水稻为代表的模式生物中进行全基因组选择中的育种值估计等数据分析。
背景技术
育种目标性状大多是复杂的数量性状,复杂农艺性状的高效选择是育种的技术瓶颈。虽然基于分子标记的MAS比传统的表型选择已经更具针对性,但MAS育种通常只能局限于少数主效位点的选择,对多基因控制的复杂农艺性状的选择效果较差。有鉴于此,Meuwissen等(2001)首次提出了全基因组选择(Genomic selection,GS)育种策略,即利用全基因组水平的分子标记数据或单倍型数据及起始训练群体中每个个体的表型数据来建立预测模型,估计每个标记的遗传效应,进而在后续的育种群体中利用全基因组每个标记的遗传效应来预测个体的育种值,根据预测的育种值选择优良后代。相对于MAS中仅利用少量显著性标记进行表型预测来选择优良单株的育种方法,GS能够将全基因组的标记位点信息都考虑在内,由此建立的预测模型能有效地避免对标记效应的有偏估计并考虑全基因组水平的不同位点互作对复杂性状的综合影响,从而确保选择的可靠性和高效性。
GS选择效率高于MAS,它不仅加速了育种进程,而且单位遗传进度的花费低于MAS。GS在动物育种中的应用表明,将全基因组选择策略引入到奶牛育种中以后,奶牛育种公司的花费就降低了将近90%。利用植物进行的模拟研究表明,全基因组选择策略的遗传进度高于传统表型选择4-25%,单位遗传进度的花费低于传统育种26-65%。CIMMYT科学家采用小麦产量性状(599个体、1279个分子标记、4个环境)、玉米产量性状(284个体、1148个分子标记、10个环境)和玉米开花期性状(264个体、1135个分子标记、10个环境)的真实数据对GS模型进行了评价,表明模型中引入标记信息比仅利用系谱信息来预测后代表现的能力大大提高,小麦预测能力从7.7%提高到35.7%,玉米的预测能力达到79%。这些研究结果都证实了基于全基因组分子标记信息建立的GS模型对复杂农艺性状的选择育种是十分有效的。
全基因组选择育种技术是以全基因组的分子标记数据和起始训练群体中每个个体的表型数据为基础,通过建模估计每个标记的遗传效应来预测后续育种群体中各个体的育种值,其选择效果在很大程度上取决于全基因组标记的密集程度。
育种值估计是GS技术的核心。最佳线性无偏预测(BLUP)是由美国数量遗传学家亨德森(C.R.Henderson)提出的育种值估计方法,其基本原理是线性统计模型方法论与数量遗传学相结合。BLUP法具有估计值无偏、估计值方差最小、可消除因选择和淘汰等原因造成的偏差等特性,获得的个体育种值具有最佳线性无偏性。BLUP混合模型的一般形式如下:
y=Xβ+Zu+e
其中y是观察值的向量;β是固定效应向量;u是随机效应向量;X和Z分别是β和u的结构矩阵;e是随机误差向量,u和e均服从正态,即u~N(0,G),e~N(0,R)。
由此可得V=Var(y)=ZGZ′+R,利用限制极大似然估计(REML)方法估计方差组分G与R,由方程可解得:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业科学院作物科学研究所;中国农业科学院深圳生物育种创新研究院;中国农业科学院深圳农业基因组研究所,未经中国农业科学院作物科学研究所;中国农业科学院深圳生物育种创新研究院;中国农业科学院深圳农业基因组研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810143549.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用