[发明专利]一种基于二代测序技术的consensus序列统计分析、可视化方法在审
申请号: | 202110456786.8 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113178231A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 司昊睿;周鹏 | 申请(专利权)人: | 中国科学院武汉病毒研究所 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B45/00 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 430000 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二代 技术 consensus 序列 统计分析 可视化 方法 | ||
本发明公开了一种基于二代测序技术的consensus序列统计分析、可视化方法,包括如下步骤:S1、获取二代测序数据中的consensus序列;S2、对所述consensus序列进行文件序列数的统计,之后提取每条序列中每个位置的碱基并进行分析判断,找到每条序列中gaps和/或简并碱基;S3、对每条序列中所述gaps和/或简并碱基的类型、个数和位置进行统计,并获取每条序列的长度;S4、分别计算所述每条序列的序列覆盖度和所述gaps和/或简并碱基位置的标准差,输出结果,完成数据统计分析;通过对consensus序列中的gaps及简并碱基的位置、数量、大小和分散程度进行自动化统计分析,确定每条序列中的gaps及简并碱基的具体信息,从而能更高效的剔除这些gaps和简并碱基的片段,完成整个基因组的测序工作。
技术领域
本发明属于二代测序技术领域,具体涉及一种基于二代测序技术的consensus序列统计分析、可视化方法。
背景技术
长期以来,测序技术一直是分子生物学相关研究中最常用的技术手段之一。基于测序技术的人类基因组计划、转录组分析、微生物基因组重测序,单核苷酸多态性等方面的分析也同时促进了生物学其他领域研究的进步和发展。DNA测序技术的发展为人类探索自身和其他生命的奥秘提供了可能,同时,基因组学时代的来临对DNA测序技术也提出了更高的要求,推动了DNA测序技术的不断进步。目前科学研究已经进入高通量测序时代,从单一、局部的基因或基因片段的研究转变成了对整个基因组的研究,在基因组从头测序和转录组测序中应用较广,继第一代测序技术之后,随着第二代、第三代测序技术的兴起和发展,测序技术逐步朝着高通量、低成本、高安全性和商业化的方向发展。近几年来,尤其是以单分子实时测序为代表的第三代测序技术开始进入人们的视野,该测序技术跨越了第一代、第二代较短读长而直接对DNA单个分子进行测序的新一代测序平台应用日益广泛。
通过结合二代测序技术及下游生信分析来获得微生物尤其是病毒的全长基因组序列已成为新物种发现,进化分析,溯源研究,流行病学调查等领域的常用方法。但是在低含量样品中的微生物尤其是病毒全长基因组获取时,常常伴随有少量或者没有二代测序reads覆盖的区域(gaps)产生,造成无法直接通过二代测序及下游生信分析获得全长基因组,需要结合一代Sanger测序的方法来验证和补充这些区域。当进行批量生物样品的第二代测序分析时,会产生大量的consensus序列,同时伴随着大量的gaps和简并碱基,给后续一代测序的引物设计步骤带来繁重的工作。
发明内容
针对上述现有技术中存在的问题,本发明的目的是提供一种基于二代测序技术的consensus序列统计分析、可视化方法,解决当前进行批量生物样品的第二代测序分析时,会产生大量的consensus序列,同时伴随着大量的gaps和简并碱基,给后续一代测序的引物设计步骤带来繁重的工作等问题。
本发明的一个目的在于提供一种基于二代测序技术的consensus序列统计分析方法。
所述统计分析方法,包括如下步骤:
S1、获取二代测序数据中的consensus序列;
S2、对所述consensus序列进行文件序列数的统计,之后提取每条序列中每个位置的碱基并进行分析判断,找到每条序列中gaps和/或简并碱基;
S3、对每条序列中所述gaps和/或简并碱基的类型、个数和位置进行统计,并获取每条序列的长度;
S4、分别计算所述每条序列的序列覆盖度和所述gaps和/或简并碱基位置的标准差,输出结果,完成数据统计分析。
通过对二代测序分析过程中产生的consensus序列中的gaps及简并碱基的位置、数量、大小和分散程度进行自动化统计分析,确定每条序列中的gaps及简并碱基的具体信息,从而能更快、更高效的剔除这些gaps和简并碱基的片段,完成整个基因组的测序工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院武汉病毒研究所,未经中国科学院武汉病毒研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110456786.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种活塞销
- 下一篇:螺旋缠绕光纤的DAS六分量地震信号解耦与恢复方法