[发明专利]用于检测串联重复区的方法、系统和计算机可读介质在审
申请号: | 201880077507.3 | 申请日: | 2018-11-30 |
公开(公告)号: | CN111433374A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | D·卡兹那德扎 | 申请(专利权)人: | 生命科技股份有限公司 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 周全;陈洁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 串联 重复 方法 系统 计算机 可读 介质 | ||
1.一种用于检测样品的FLT3基因中的内部串联重复区的方法,其包括:
在引物库的存在下扩增核酸样品以产生多个扩增子,所述引物库包含靶向所述FLT3基因的外显子的多个靶标特异性引物;
对所述扩增子进行测序,以产生多个读段;
将所述读段映射至参考序列,其中所述参考序列包括所述FLT3基因的外显子的被靶向区域,其中所述映射产生包含所述读段与所述参考序列的多个比对以及与沿着所述参考序列的位置对应的多个列的堆积,其中多个读段的一部分被部分地映射到用于多个部分映射的读段的参考序列,其中部分映射的读段包括映射部分、软剪接部分和断点;
分析与所述堆积的列相交的所述部分映射的读段以进行串联复制,包含:
通过将所述软剪接部分与和所述断点相邻的所述映射部分进行比较来检测所述软剪接部分中的重复区;
确定在所述软剪接部分中所述重复区的插入片段尺寸;
基于所述插入片段尺寸将所述部分映射的读段分配给一个类别,以产生与多种插入片段尺寸相对应的多个类别,每个类别具有与具有相应的插入片段尺寸的所述部分映射的读段相对应的多个成员;
将所述类别转换成与该列相对应的特征,其中特征包含所述插入片段尺寸和插入片段位置处的插入片段序列;和
合并对应于表示同一插入片段的一列或多列的特征,以确定串联重复区的位置和尺寸。
2.根据权利要求1所述的方法,其中,所述分析与所述堆积的列相交的部分映射的读段的步骤还包括:确定所述部分映射的读段是否在表示比对的终点和所述软剪接部分的起点的断点处与所述列相交,其中,所述部分映射的读段是正向读段。
3.根据权利要求1所述的方法,其中,所述分析与所述堆积的列相交的部分映射的读段的步骤还包括:确定所述部分映射的读段是否在表示比对的起点和所述软剪接部分的终点的断点处与所述列相交,其中,所述部分映射的读段是反向读段。
4.根据权利要求1所述的方法,其中,所述分析与所述堆积的列相交的部分映射的读段的步骤还包括:确定所述软剪接部分的锚部分,所述锚部分与所述参考序列中与所述断点相邻的部分匹配。
5.根据权利要求4所述的方法,其中,所述确定锚部分的步骤还包括:将字符串匹配方法应用于所述参考序列中与所述断点相邻的所述软剪接部分和未映射部分。
6.根据权利要求4所述的方法,其中,所述确定所述重复区的插入片段尺寸的步骤基于从所述断点到所述软剪接部分中的所述锚部分的位置的距离。
7.根据权利要求1所述的方法,其中,所述检测重复区的步骤将字符串匹配方法应用于与所述断点相邻的所述软剪接部分和所述映射部分。
8.根据权利要求1所述的方法,所述方法还包括基于所述类别中的成员的数目过滤每一列的所述类别。
9.根据权利要求8所述的方法,其中,所述过滤基于所述类别中的所述成员的数目的绝对计数。
10.根据权利要求8所述的方法,其中,所述过滤基于所述类别中的所述成员的数目与所述插入片段位置处的覆盖率的比率。
11.根据权利要求1所述的方法,其中,所述合并特征的步骤还包括:将单链路聚类应用于所述特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于生命科技股份有限公司,未经生命科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880077507.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于检查吸烟制品的设备
- 下一篇:热收缩聚酯膜