[发明专利]测序建库的引物序列处理方法、装置、设备及存储介质有效
申请号: | 201810490410.7 | 申请日: | 2018-05-21 |
公开(公告)号: | CN108664767B | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 刘晶星;毛琳琳;严慧;赵薇薇;于世辉 | 申请(专利权)人: | 广州金域医学检验中心有限公司;广州金域医学检验集团股份有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 44224 广州华进联合专利商标代理有限公司 | 代理人: | 林青中 |
地址: | 510005 广东省广州市开发*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测序 比对结果 存储介质 引物序列 比对 建库 结果分析 扩增子 引物 正向 测序片段 测序数据 后续处理 扩增片段 数据信息 基因组 参考 保留 保证 | ||
本发明涉及一种测序建库的引物序列处理方法、装置、设备及存储介质。该方法包括获取将测序数据比对到参考基因组得到的测序比对文件、从所述测序比对文件得到正向比对结果和反向比对结果、确定正向比对结果中的各read对应的扩增子,以及确定反向比对结果中的各read对应的扩增子等步骤。该测序建库的引物序列处理方法、装置、设备和存储介质通过对测序结果进行处理,可以精准识别扩增片段中的引物部分,经过后续处理,如软切或硬切,可以排除该引物部分对测序结果分析的影响,可以最大限度的保留待测序片段的数据信息,保证测序结果分析的准确性和可靠性。
技术领域
本发明涉及二代测序技术领域,尤其是涉及一种测序建库的引物序列处理方法、装置、设备及存储介质。
背景技术
一般通过扩增构建的NGS(Next-generation sequencing,下一代测序、二代测序,又名High-throughput sequencing,即下一代测序)测序文库,在分析时会将扩增范围外的引物对应的测序结果排除,因为这部分测序结果有一半来源于引物而不是扩增的待测片段,从而导致了引物部分测序数据的丢失,而如果不排除这部分序列便会引入分析误差。对于一个较大的扩增片段,往往需要多对引物进行多重扩增才能扩增完整,在扩增片段的中间也有引物序列,这时候就不能简单地通过扩增片段范围来排除,否则就会导致引物序列掺入测序结果从而引入分析误差。例如引物对应的待测序片段上有一个突变,而引物是和参考序列一致没有突变的,因此直接分析测序结果会导致该突变的突变频率降低。
发明内容
基于此,针对上述技术问题,有必要提供一种测序建库的引物序列处理方法、装置、设备及存储介质。
本发明解决上述技术问题的技术方案如下。
一种测序建库的引物序列处理方法,包括如下步骤:
获取将测序数据比对到参考基因组得到的测序比对文件;
从所述测序比对文件得到正向比对结果和反向比对结果;
对所述正向比对结果中的各read,从起始位置大于当前read的原始比对起始位置的所有扩增子中,确定起始位置最接近当前read的原始比对起始位置的扩增子作为与当前read对应的扩增子,得到正向比对结果中各read对应的扩增子;
对所述反向比对结果中的各read,从终止位置小于当前read的原始比对终止位置的所有扩增子中,确定终止位置最接近当前read的原始比对终止位置的扩增子作为与当前read对应的扩增子,得到反向比对结果中各read对应的扩增子。
在其中一个实施例中,在得到正向比对结果中各read对应的扩增子之后,还包括:
将正向比对的各read的比对起始位置由其原始比对起始位置重新确定为与各read对应的扩增子的起始位置。
在其中一个实施例中,在得到正向比对结果中各read对应的扩增子之后,还包括:
对正向比对的各read的原始比对起始位置与与其对应的扩增子的起始位置之间的序列部分进行软切、硬切、或提取出原始序列数据后,在所述原始序列数据中切除该序列部分的序列数据。
在其中一个实施例中,所述测序比对文件为bam格式文件,所述软切包括:
根据正向比对结果中的各read对应的扩增子的起始位置与各read的原始比对起始位置之间的碱基数量,确定各read的正向引物待切碱基数量;
将所述测序比对文件的CIGAR值中前面与所述正向引物待切碱基数量相同数量的碱基全部确定为软切标记的碱基,后面的其他碱基根据所述正向引物待切碱基数量、相应read的总碱基数量以及原始标记重新标记。
在其中一个实施例中,在得到反向比对结果中各read对应的扩增子之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州金域医学检验中心有限公司;广州金域医学检验集团股份有限公司,未经广州金域医学检验中心有限公司;广州金域医学检验集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810490410.7/2.html,转载请声明来源钻瓜专利网。