[发明专利]序列比对方法、序列校正方法及其装置有效

专利信息
申请号: 201910787734.1 申请日: 2019-08-23
公开(公告)号: CN112397148B 公开(公告)日: 2023-10-03
发明(设计)人: 胡江;韩悦;汪德鹏 申请(专利权)人: 武汉希望组生物科技有限公司
主分类号: G16B30/10 分类号: G16B30/10;G16B30/20
代理公司: 北京超凡宏宇知识产权代理有限公司 11463 代理人: 何明伦
地址: 430000 湖北省武汉市东湖新技术开*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 序列 方法 校正 及其 装置
【说明书】:

发明提供了一种序列比对方法、序列校正方法及其装置,涉及生物信息技术领域。该序列比对方法主要包括区间比对、碱基比对,配合序列压缩、比对结果优化存储手段,实现了高效、高准确度的比对。该序列校正方法是基于比对结果,通过正序计分、反序回溯,进一步的对低质量区进行校正,实现高效、高准确度的比对。

技术领域

本发明涉及生物信息技术领域,尤其是涉及一种序列比对方法、序列校正方法及装置。

背景技术

随着高通量测序技术的飞速发展,其已成为研究物种进化、诊断疾病成因等生物学问题 的重要手段。

其中Illumina测序平台为主的第二代测序技术以其数据产出量高、成本低廉、碱基准确 率高的特点,在基因组学研究领域得到广泛的应用。基因组组装是指通过测序序列结果重建 完整的基因组序列,组装结果准确性和完整性对于后续基因注释分析、SNP和结构变异检测 等方面产生重要影响。由于存在重复序列和杂合度等复杂情况,采用二代测序技术产生的短 片段序列,难以组装得到完整的基因组序列。以人类基因组为例,现有通过二代测序组装的 人类参考基因组序列中仍存在5%~10%未明确的复杂区域。

第三代测序技术平台,以Pacific Biosciences和Oxford NanoporeTechnologies为代表,具 有长读长的显著特点,能够产生大于10k的长片段序列,并且对GC含量较高的区域测序结 果无偏好性,为基因组研究领域带来了重大的变革。三代测序技术在提升序列长度的同时, 与二代测序相比(错误率0.1%)却带来了碱基序列错误率较高的缺陷(错误率15%~20%), 测序序列中的错误信息对后续进行数据分析造成了重大的影响。对于三代测序数据,通常采 用Overlap-Layout-Consensus(OLC)算法的策略进行基因组组装,但由于序列错误率高的缺 陷,极大增加了组装的复杂性和计算序列间相互关系的资源消耗。现有针对三代测序数据的 基因组组装软件,或采用先校正测序数据后组装基因组的方法,或采用先组装基因组后对组 装结果进行校正的方法。上述两种方法均涉及序列间的相互比对运算,并基于比对结果校正 测序数据中错误信息。现有比对方法中存在大量的无效比对,该无效比对将连锁影响校正的 准确性,同时比对结果需要占据巨大的存储空间,因此比对及校正步骤在基因组组装中占据 了最长的时间消耗,并对于内存需求量巨大。以组装哺乳动物基因组三代测序数据为例,现 有软件需要消耗数万CPU核时,并且不能处理超大型基因组的组装,严重阻碍了三代测序技 术的广泛应用。因此亟待开发针对性处理长读长测序数据的比对及校正方法,有效较少现有 方法的计算资源消耗,提升运行的效率,充分解锁长读长测序技术在基因组学研究领域的潜 力。所述长读长测序包括,但不限于,单分子实时测序(SMRT)技术和纳米孔测序技术。

发明内容

本发明的目的在于提供一种序列比对方法、序列校正方法及装置,可以较好的减少无效 比对数量,并提高序列校正的准确性。

本发明提供的一种序列对比方法,所述方法包括:S101、获取测序序列,根据第一预设 数据长度在所述测序序列中筛选第一序列,根据第二预设长度在所述测序序列中筛选第二序 列;S102、将所述第一序列与第二序列进行比对,得到第一参考序列、第一比对序列;S103、 计算所述第一比对序列对所述第一参考序列的覆盖度,基于所述覆盖度筛选所述第一参考序 列、第一比对序列,获得第二参考序列、第二比对序列;S104、计算所述第二参考序列与第 二比对序列之间的比对路径,基于编辑距离筛选所述第二参考序列、第二比对序列,获得第 三参考序列、第三比对序列。

进一步,所述方法包括基于二进制数码对序列进行转换和存储,所述序列包括所述测序 序列、所述第一序列、所述第二序列、所述第一参考序列、所述第一比对序列、所述第二参 考序列、所述第二比对序列、所述第三参考序列和所述第三比对序列中的一种或多种;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉希望组生物科技有限公司,未经武汉希望组生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910787734.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top