[发明专利]序列比对方法、序列校正方法及其装置有效
申请号: | 201910787734.1 | 申请日: | 2019-08-23 |
公开(公告)号: | CN112397148B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 胡江;韩悦;汪德鹏 | 申请(专利权)人: | 武汉希望组生物科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B30/20 |
代理公司: | 北京超凡宏宇知识产权代理有限公司 11463 | 代理人: | 何明伦 |
地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序列 方法 校正 及其 装置 | ||
1.一种序列对比方法,其特征在于,所述方法包括:
S101、获取测序序列,根据第一预设数据长度在所述测序序列中筛选第一序列,根据第二预设长度在所述测序序列中筛选第二序列;
S102、将所述第一序列与第二序列进行比对,得到第一参考序列、第一比对序列;
S103、计算所述第一比对序列对所述第一参考序列的覆盖度,基于所述覆盖度筛选所述第一参考序列、第一比对序列,获得第二参考序列、第二比对序列;
S104、计算所述第二参考序列与第二比对序列之间的比对路径,基于编辑距离筛选所述第二参考序列、第二比对序列,获得第三参考序列、第三比对序列。
2.根据权利要求1所述的方法,其特征在于,所述方法包括:
基于二进制数码对序列进行转换和存储;所述序列包括所述测序序列、所述第一序列、所述第二序列、所述第一参考序列、所述第一比对序列、所述第二参考序列、所述第二比对序列、所述第三参考序列和所述第三比对序列中的一种或多种;
优选的,所述基于二进制数码对序列进行转换和存储的步骤,包括:
按照预设分组将所述序列划分为多个碱基组合;其中,所述预设分组包括将相邻的四个碱基确定为一个碱基组合;
根据碱基与二进制数码之间预设的转换关系,将所述序列的碱基转换为二进制数码;
对所述序列中少于四个碱基的组合,采用指定的二进制数码对所述少于四个碱基的组合进行补位扩充,得到满足所述预设分组的二进制序列。
3.根据权利要求1所述的方法,其特征在于,所述方法包括比对结果的存储优化:
纪录比对序列编号、比对方向、比对序列比对区间起始、比对序列比对区间终止、参考序列编号、参考序列比对区间起始、参考序列比对区间终止存储比对结果;
优选的,纪录比对序列编号差值、参考序列编号差值、参考序列比对区间长度与比对序列比对区间长度差值存储比对结果;
其中所述比对序列包括第一比对序列、第二比对序列、第三比对序列中的一种或多种,所述参考序列包括第一参考序列、第二参考序列、第三参考序列中的一种或多种。
4.根据权利要求3所述的方法,其特征在于,所述存储比对结果的方法包括:
按照4字节进行存储;
并且,每字节使用7比特位纪录数值,不足7比特位的使用特定二进制数码进行填充;剩余1比特位使用特定二进制数码标识比对结果是否终止。
5.根据权利要求1所述的方法,其特征在于,步骤S103中,
所述覆盖度包括窗口覆盖度、整体覆盖度;其中,所述窗口覆盖度为,按照预设第一碱基数将所述第一参考序列划分为多个窗口,计算所述第一比对序列对每个窗口的覆盖度;所述整体覆盖度为,所述第一参考序列的平均覆盖度;
所述筛选的方法为,将满足预设第一覆盖条件的所述第一比对序列确定为所述第二比对序列,至所述第二比对序列对所述第一参考序列的所述整体覆盖度达到预设第一覆盖度;其中,所述第一覆盖条件为,所述窗口覆盖度小于预设第二覆盖度,且小于所述整体覆盖度的第一预设倍数;
优选地,按照所述第一比对序列与所述第一参考序列重叠长度由长至短的顺序,进行所述覆盖度计算及所述筛选。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括对嵌合体序列的过滤,其中所述嵌合体序列为,
所述第一参考序列中满足预设第二覆盖条件的序列;
其中,所述第二覆盖条件为,至少存在一个窗口,所述窗口的窗口覆盖度小于预设第三覆盖度且与所述窗口毗邻的指定个数的窗口的窗口覆盖度均大于预设第四覆盖度;或者,至少存在一个窗口,所述窗口的窗口覆盖度小于预设第五覆盖度;其中,所述第五覆盖度阈值为与当前窗口毗邻的指定个数的窗口的窗口覆盖度平均值的第二预设倍数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉希望组生物科技有限公司,未经武汉希望组生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910787734.1/1.html,转载请声明来源钻瓜专利网。