[发明专利]序列比对方法、序列校正方法及其装置有效
申请号: | 201910787734.1 | 申请日: | 2019-08-23 |
公开(公告)号: | CN112397148B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 胡江;韩悦;汪德鹏 | 申请(专利权)人: | 武汉希望组生物科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B30/20 |
代理公司: | 北京超凡宏宇知识产权代理有限公司 11463 | 代理人: | 何明伦 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序列 方法 校正 及其 装置 | ||
本发明提供了一种序列比对方法、序列校正方法及其装置,涉及生物信息技术领域。该序列比对方法主要包括区间比对、碱基比对,配合序列压缩、比对结果优化存储手段,实现了高效、高准确度的比对。该序列校正方法是基于比对结果,通过正序计分、反序回溯,进一步的对低质量区进行校正,实现高效、高准确度的比对。
技术领域
本发明涉及生物信息技术领域,尤其是涉及一种序列比对方法、序列校正方法及装置。
背景技术
随着高通量测序技术的飞速发展,其已成为研究物种进化、诊断疾病成因等生物学问题 的重要手段。
其中Illumina测序平台为主的第二代测序技术以其数据产出量高、成本低廉、碱基准确 率高的特点,在基因组学研究领域得到广泛的应用。基因组组装是指通过测序序列结果重建 完整的基因组序列,组装结果准确性和完整性对于后续基因注释分析、SNP和结构变异检测 等方面产生重要影响。由于存在重复序列和杂合度等复杂情况,采用二代测序技术产生的短 片段序列,难以组装得到完整的基因组序列。以人类基因组为例,现有通过二代测序组装的 人类参考基因组序列中仍存在5%~10%未明确的复杂区域。
第三代测序技术平台,以Pacific Biosciences和Oxford NanoporeTechnologies为代表,具 有长读长的显著特点,能够产生大于10k的长片段序列,并且对GC含量较高的区域测序结 果无偏好性,为基因组研究领域带来了重大的变革。三代测序技术在提升序列长度的同时, 与二代测序相比(错误率0.1%)却带来了碱基序列错误率较高的缺陷(错误率15%~20%), 测序序列中的错误信息对后续进行数据分析造成了重大的影响。对于三代测序数据,通常采 用Overlap-Layout-Consensus(OLC)算法的策略进行基因组组装,但由于序列错误率高的缺 陷,极大增加了组装的复杂性和计算序列间相互关系的资源消耗。现有针对三代测序数据的 基因组组装软件,或采用先校正测序数据后组装基因组的方法,或采用先组装基因组后对组 装结果进行校正的方法。上述两种方法均涉及序列间的相互比对运算,并基于比对结果校正 测序数据中错误信息。现有比对方法中存在大量的无效比对,该无效比对将连锁影响校正的 准确性,同时比对结果需要占据巨大的存储空间,因此比对及校正步骤在基因组组装中占据 了最长的时间消耗,并对于内存需求量巨大。以组装哺乳动物基因组三代测序数据为例,现 有软件需要消耗数万CPU核时,并且不能处理超大型基因组的组装,严重阻碍了三代测序技 术的广泛应用。因此亟待开发针对性处理长读长测序数据的比对及校正方法,有效较少现有 方法的计算资源消耗,提升运行的效率,充分解锁长读长测序技术在基因组学研究领域的潜 力。所述长读长测序包括,但不限于,单分子实时测序(SMRT)技术和纳米孔测序技术。
发明内容
本发明的目的在于提供一种序列比对方法、序列校正方法及装置,可以较好的减少无效 比对数量,并提高序列校正的准确性。
本发明提供的一种序列对比方法,所述方法包括:S101、获取测序序列,根据第一预设 数据长度在所述测序序列中筛选第一序列,根据第二预设长度在所述测序序列中筛选第二序 列;S102、将所述第一序列与第二序列进行比对,得到第一参考序列、第一比对序列;S103、 计算所述第一比对序列对所述第一参考序列的覆盖度,基于所述覆盖度筛选所述第一参考序 列、第一比对序列,获得第二参考序列、第二比对序列;S104、计算所述第二参考序列与第 二比对序列之间的比对路径,基于编辑距离筛选所述第二参考序列、第二比对序列,获得第 三参考序列、第三比对序列。
进一步,所述方法包括基于二进制数码对序列进行转换和存储,所述序列包括所述测序 序列、所述第一序列、所述第二序列、所述第一参考序列、所述第一比对序列、所述第二参 考序列、所述第二比对序列、所述第三参考序列和所述第三比对序列中的一种或多种;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉希望组生物科技有限公司,未经武汉希望组生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910787734.1/2.html,转载请声明来源钻瓜专利网。