[发明专利]水稻多样本变异整合图谱OsMS-IVMap1.0的创建有效
申请号: | 201810143550.7 | 申请日: | 2018-02-12 |
公开(公告)号: | CN108363906B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 郑天清;黎志康;徐建龙;王春超;王文生;赵秀琴;陈凯 | 申请(专利权)人: | 中国农业科学院作物科学研究所;中国农业科学院深圳生物育种创新研究院;中国农业科学院深圳农业基因组研究所 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/10 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 关畅 |
地址: | 100081 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 水稻 多样 变异 整合 图谱 osms ivmap1 创建 | ||
1.一种利用全基因组多样本多维度的变异信息创建变异整合图谱OsMS-IVMap1.0的方法,按照如下步骤进行:
1)通过基因组重测序获得候选样本的大量基因组reads信息,至少覆盖基因组长度10X以上;
2)将上述reads通过常规的序列比对方法与参考基因组进行比对,获取reads的物理位置信息,并生成包含SNP和短片段InDel变异信息的bam格式文件;
3)从bam文件中提取SNP信息数据集;通过设置参数,过滤SNP信息,获得缺失数据最少的高质量SNP数据集;所述参数设置为:每个位点的mapping质量值大于20、变异质量值大于50,而且每个碱基至少有来自2个以上reads数据的支持,MAF值>0.001;
4)设置阈值,从bam文件中提取InDel信息,生成InDel数据集;所述阈值设置为:每个位点的mapping质量值大于20、变异质量值大于50,而且每个碱基至少有来自2个以上reads数据的支持,MAF值>0.001;
5)利用NovoBreak软件将各样本基因组与参考基因组日本晴比较,检测长度在100bp以上的大片段插入、缺失和倒位的结构变异即SV信息,生成SV数据集;
6)统一SNP、InDel和SV这三个变异数据集的格式,生成表1所示的格式;
表1
CHR | POS | TYPE | REF | SNP|InDel | SV_Type | SV_CHR | SV_TPOS |
;
7)依据以上变异在参考基因组日本晴的物理位置信息,将上述变异位点分染色体进行线性排列,生成变异整合框架图,生成表2所示的格式;
表2
8)对照框架图位置,将各个样本所包含的变异信息对照排列,空缺的部分用NA表示,生成包含至少3000以上样本的变异整合图谱数据集OsMS-IVMap1.0,具体样式表3所示;
表3
CHR | POS | TYPE | REF | SNP|InDel | SV_Type | SV_CHR | SV_TPO | SS_1 | S_2 |
1 | 1002 | SNP | T | C | NA | NA | NA | - | - |
1 | 1003 | SNP | A | T | NA | NA | NA | - | A |
1 | 1016 | InDel | TA | TAA,T | NA | NA | NA | 0/0 | 0/0 |
1 | 1023 | InDel | TA | TAA,T | NA | NA | NA | 0/0 | 0/0 |
1 | 1030 | InDel | TA | TAA,T | NA | NA | NA | 0/2 | 0/0 |
1 | 1037 | InDel | TA | TAA,T | NA | NA | NA | 0/0 | 0/0 |
1 | 1044 | InDel | TA | TAA,TCA,T | NA | NA | NA | 0/0 | 0/0 |
1 | 1058 | InDel | T | TA,TAA | NA | NA | NA | 0/0 | 0/0 |
1 | 1060 | InDel | A | AG,AC | NA | NA | NA | 0/0 | 0/2 |
1 | 1064 | SNP | T | C | NA | NA | NA | T | Y |
1 | 1065 | SNP | A | T | NA | NA | NA | A | W |
1 | 1067 | SNP | A | C,G | NA | NA | NA | A | A |
1 | 1070 | SNP | C | T | NA | NA | NA | C | C |
1 | 1071 | SNP | T | A | NA | NA | NA | T | W |
1 | 1071 | InDel | TAACCCTA | TAAAACCCTA,T,TAAACCCT | ANA | NA | NA | 0/0 | 0/0 |
1 | 1073 | InDel | A | AAC,AG | NA | NA | NA | 0/0 | 0/0 |
1 | 1077 | InDel | TA | TAA,T | NA | NA | NA | 0/0 | 0/1 |
1 | 1078 | SV | NA | NA | TRA | chr06 | 46612 | 0 | 0 |
1 | 1078 | SV | NA | NA | TRA | chr06 | 60913 | 0 | 0 |
1 | 1078 | SV | NA | NA | TRA | chr06 | 76456 | 0 | 0 |
。
2.利用权利要求1所述方法创建的变异整合图谱OsMS-IVMap1.0在水稻的分子遗传学和分子育种中应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业科学院作物科学研究所;中国农业科学院深圳生物育种创新研究院;中国农业科学院深圳农业基因组研究所,未经中国农业科学院作物科学研究所;中国农业科学院深圳生物育种创新研究院;中国农业科学院深圳农业基因组研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810143550.7/1.html,转载请声明来源钻瓜专利网。