[发明专利]一种在植物基因组中检测体细胞突变的方法在审
申请号: | 202210145716.5 | 申请日: | 2022-02-17 |
公开(公告)号: | CN114512186A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 杨四海;季逸伦;张小辉;王龙 | 申请(专利权)人: | 南京大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B25/10 |
代理公司: | 江苏银创律师事务所 32242 | 代理人: | 何震花 |
地址: | 210033 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 植物 基因组 检测 体细胞 突变 方法 | ||
1.一种在植物基因组中检测体细胞突变的方法,其特征在于包括如下步骤:
(1)重测序数据的评估:利用FastQC等软件对重测序数据进行质检和评估,过滤得到clean data;
(2)重测序数据的拼装:使用BWA-mem的默认参数将clean data比对到参考基因组上,得到原始SAM文件,通过Picard的SortSam模块将SAM文件排序并转变为BAM格式;
(3)突变位点的鉴定:利用GATK中识别变异的两种不同算法UG和HC,选用 “-rfMappingQuality -mmq 20” 参数过滤比对质量mapping quality小于20的reads,获得包含所有原始变异位点的VCF文件;
(4)突变位点的评估:选用samtools的mpileup模块与VarScan,统计候选单核苷酸变异位点SNV的实际比对reads数与比对质量信息;选用HC的joint-calling模式重新对插入缺失位点INDEL进行识别,进一步明确位点信息;
(5)突变位点的筛选:基于各个样品对应的发育topology-based关系和等位位点的出现频率frequency-based可以筛选出突变候选位点;
(6)候选突变位点的分类与标签化:对所有候选突变的各种特征加上标签,特征包括但不限于:支持突变位点的reads数量、突变reads的测序链是否存在偏好、突变的碱基质量值、类突变位点在对照样本中的出现情况、区域测序质量、区域比对质量、附近是否存在插入缺失位点、位点在不同发育关系的样本中的分布状态、序列差异度,根据突变特征所指示的可靠程度进行排序和分级,降低假阳性和假阴性率;
(7)突变位点的人工检验:使用IGV Integrative Genomics Viewer进行人工检验,排除一些程序未能正确添加标签的部分情况,外源性污染或者拼装错误而导致的一些假阳性结果。
2.根据权利要求1所述的检测植物基因组中体细胞突变的方法,其特征在于:在步骤(1)中,通过MD5值校验,根据测序数据GC含量,测序深度等对重测序数据进行质检,去除reads接头,含N比例大于10%的reads,以及低质量碱基占reads数比例超过50%的reads,经过过滤之后得到clean data。
3.根据权利要求1所述的检测植物基因组中体细胞突变的方法,其特征在于:在步骤(2)中,使用MarkDuplicates模块标记异常扩增的reads,并利用GATK的RealignerTargetCreator和IndelRealigner对插入与缺失区域进行重比对。
4.根据权利要求1所述的检测植物基因组中体细胞突变的方法,其特征在于:在步骤(5)中,对于体细胞突变,亲缘关系越近或物理位置越近的样品含有相同突变的可能性越大。
5.根据权利要求4所述的检测植物基因组中体细胞突变的方法,其特征在于:在步骤(5)中,来自同一分支的叶片样品间常共享体细胞突变,而不同分支的叶片样品筛选的共同突变往往是假的,基于各个样品突变的拓扑topology-based关系可以筛选出更可靠的突变位点。
6.根据权利要求1所述的检测植物基因组中体细胞突变的方法,其特征在于:在步骤(5)中,根据等位位点的频率frequency-based,所有样品中共有的突变或仅某个样品中包含的突变且reads数目5,可以删除这些未固定的变异位点和存在显著偏态的位点,去除部分假阳性突变位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210145716.5/1.html,转载请声明来源钻瓜专利网。