[发明专利]一种基因组的组装方法及装置有效
申请号: | 201811068666.5 | 申请日: | 2018-09-13 |
公开(公告)号: | CN109326323B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 郑洪坤;刘福;刘敏;李绪明;邓德晶;刘东源 | 申请(专利权)人: | 北京百迈客生物科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 101300 北京市顺义区南*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基因组 组装 方法 装置 | ||
本发明实施例提供一种基因组的组装方法及装置,所述方法包括:获取纠错后的基因信息,所述基因信息包括基因组和比对信息;根据所述基因组和所述比对信息进行基因组组装;若判断获知组装结果未达到预设条件,对所述组装结果进行分区域聚类处理,并将处理结果进行重新组装。所述装置执行上述方法。本发明实施例提供的基因组的组装方法及装置,通过将未达到预设条件的组装结果进行分区域聚类处理,并将处理结果进行重新组装,能够提高基因组组装通用性和准确性。
技术领域
本发明实施例涉及基因工程技术领域,具体涉及一种基因组的组装方法及装置。
背景技术
随着基因技术的发展,基因组的组装显得尤为重要。
现有的基因组装方法通常采用如下三种软件:LACHESIS,SALSA和3d-dna。LACHESIS是Hi-C辅助基因组组装的开篇的软件,相对来说通用性较强,且能组装到染色体水平,但是,受基因组组装水平影响较大,尤其针对目前的三代测序组装基因组,在划分染色体群组上容易出现染色体的融合,组装准确性差;此软件也缺少对序列的纠错功能,以及全基因组bin热图评估组装准确性功能,尤其对植物基因组组装的组装效果较差。SALSA是一个针对三代组装的基因组进行Hi-C辅助基因组组装,仅提升Scaffold指标,不能获得染色体水平的组装。3d-dna软件具备对基因组进行先纠错再组装的功能,但参数复杂,无全基因组考虑,仅为单条序列考虑,容易产生过度纠错;而且并不能划分成真实数目的染色体,存在大量的染色体融合结果;再次,对于植物及真菌基因组的应用效果较差,此软件通用性一般。
因此,如何避免上述缺陷,提高基因组组装通用性和准确性,成为亟须解决的问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种基因组的组装方法及装置。
第一方面,本发明实施例提供一种基因组的组装方法,所述方法包括:
获取纠错后的基因信息,所述基因信息包括基因组和比对信息;
根据所述基因组和所述比对信息进行基因组组装;
若判断获知组装结果未达到预设条件,对所述组装结果进行分区域聚类处理,并将处理结果进行重新组装。
第二方面,本发明实施例提供一种基因组的组装装置,所述装置包括:
获取单元,用于获取纠错后的基因信息,所述基因信息包括基因组和比对信息;
组装单元,用于根据所述基因组和所述比对信息进行基因组组装;
重组装单元,用于若判断获知组装结果未达到预设条件,对所述组装结果进行分区域聚类处理,并将处理结果进行重新组装。
第三方面,本发明实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:
获取纠错后的基因信息,所述基因信息包括基因组和比对信息;
根据所述基因组和所述比对信息进行基因组组装;
若判断获知组装结果未达到预设条件,对所述组装结果进行分区域聚类处理,并将处理结果进行重新组装。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,包括:
所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:
获取纠错后的基因信息,所述基因信息包括基因组和比对信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百迈客生物科技有限公司,未经北京百迈客生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811068666.5/2.html,转载请声明来源钻瓜专利网。