[发明专利]一种多倍体生物基因组二倍化程度量化评估的方法有效
申请号: | 202010398936.X | 申请日: | 2020-05-12 |
公开(公告)号: | CN111583995B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 刘海平;牟振波;肖世俊 | 申请(专利权)人: | 西藏自治区农牧科学院水产科学研究所 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B30/00 |
代理公司: | 武汉天领众智专利代理事务所(普通合伙) 42300 | 代理人: | 杨建军 |
地址: | 850000 西藏自*** | 国省代码: | 西藏;54 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多倍体 生物 基因组 二倍 程度 量化 评估 方法 | ||
1.一种多倍体生物基因组二倍化程度量化评估的方法,其特征在于,包括以下步骤:
S1:根据基因组的K-mer分析结果,评估基因组的杂合度;
S2:根据基因组的杂合度特征,构建多倍体基因组特征模型,利用所述步骤S1获得的信息数据,计算基因组二倍化程度,具体为:
;
M为基因组K-mer总数;
N为重复区K-mer总数;
α为二倍化率;
β为二倍体重复序列所占比率;
K为基因组杂合;
S3:模拟不同二倍化程度的多倍体基因组,在该多倍体基因组特征模型基础上,模拟不同二倍化程度下的基因组序列,利用步骤S2中构建的二倍化率的关系,计算模拟基因组的二倍化率;
S4:评估多倍体二倍化率的准确性,并计算获得该多倍体基因组的二倍化程度,具体为:
根据步骤S3中的模拟的二倍化和计算获得二倍化率,评估二倍化率量化评估结果的准确性,以评估步骤S2中模型的准确性,在二倍化率量化评估准确性的基础上,利用真实的基因组序列按照步骤S2计算获得多倍体基因组的二倍化率。
2.根据权利要求1所述的一种多倍体生物基因组二倍化程度量化评估的方法,其特征在于,所述步骤S1为:通过多倍体基因组二代高通量重测序数据,统计基因组重测序数据的Kmer的类型,以及每一种类型的个数,从而构建全基因组Kmer峰图,根据峰图特征判断基因组大小、杂合度。
3.根据权利要求1所述的一种多倍体生物基因组二倍化程度量化评估的方法,其特征在于,所述步骤S1中统计基因组重测序数据的Kmer读长为17bp。
4.根据权利要求1所述的一种多倍体生物基因组二倍化程度量化评估的方法,其特征在于,所述步骤S3为:在基因组上随机引入单核苷酸突变和小片段插入缺失突变,使得模拟的多倍体基因组的二倍化程度为0.1到0.9,模拟间隔为0.1,从而获得不同二倍化程度的多倍体基因组标准数据。
5.根据权利要求1所述的一种多倍体生物基因组二倍化程度量化评估的方法,其特征在于,所述步骤S4评估方法为:利用所述步骤S2计算所得二倍化率,与所述步骤S3所得模拟标准进行线性回归评估模型准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西藏自治区农牧科学院水产科学研究所,未经西藏自治区农牧科学院水产科学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010398936.X/1.html,转载请声明来源钻瓜专利网。