[发明专利]一种大片段插入或缺失的预测方法及系统有效
申请号: | 201710190589.X | 申请日: | 2017-03-28 |
公开(公告)号: | CN106951731B | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 陈丽娟;王凯;秦公炜 | 申请(专利权)人: | 至本医疗科技(上海)有限公司;至本医疗科技江苏有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B25/20 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇;马菁平 |
地址: | 200120 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 片段 插入 缺失 预测 方法 系统 | ||
1.一种大片段插入或缺失的预测方法,其特征在于,包括:
将待测样本目标区域的多条基因测序序列进行筛选以及碱基错误校正处理,获得待测样本目标区域的多条高质量测序序列;
对待测样本目标区域的多条高质量测序序列进行基于冗余信息去除的组装处理,获得保留了原始遗传信息且去冗余信息测序序列的组装序列;
将所述组装序列与参考序列进行比对,根据比对结果获得大片段插入或缺失的位置信息;
其中,所述待测样本目标区域是利用人类参考基因组中的外显子区域或癌症相关的基因区域得到的;
所述的基于冗余信息去除的组装处理包括:
对比所述多条高质量测序序列的首尾碱基信息,得到各个高质量测序序列之间首尾交叠关系;
通过对所述各个高质量测序序列之间首尾交叠关系的分析,删除所述各个测序序列之间冗余的首尾交叠关系,得到所述各个高质量测序序列之间简化后的首尾交叠关系;
根据所述简化的首尾交叠关系,对所述各个高质量测序序列进行组装,得到所述组装序列,使各个高质量测序序列只有单向的一条近邻序列。
2.如权利要求1所述的方法,其特征在于,所述利用人类参考基因组中的外显子区域或癌症相关的基因区域得到待测样本目标区域包括:
对人类参考基因组中的外显子区域或癌症相关的基因区域进行目标筛选,获得包含人类参考基因组中的所有外显子区域或所有癌症相关的基因区域的靶向基因库;
根据所述靶向基因库设计探针,将其与待测样本进行杂交,获得目标区域范围内的待测样本DNA片段;
对所述目标区域范围内的待测样本DNA片段进行建库和测序后,得到待测样本目标区域的多条基因测序序列。
3.如权利要求1所述的方法,其特征在于,所述将待测样本目标区域的多条基因测序序列进行筛选包括:
去掉含有接头序列的所述测序后的基因序列;
根据设置的碱基质量阈值,去除低于碱基质量阈值的测序后的基因序列。
4.如权利要求1所述的方法,其特征在于,所述将待测样本目标区域的多条基因测序序列进行碱基错误校正处理是将每条测序序列进行修正使序列上每一个k-mer均为高频。
5.如权利要求1所述方法,其特征在于,所述大片段是长度≥10bp的基因片段。
6.一种预测大片段插入或缺失的系统,其特征在于,包括:
筛选模块,用于筛选待测样本目标区域的多条基因测序序列,获得筛选后的多条基因测序序列;
碱基校正模块,用于将从筛选模块筛选获得的多条测序序列进行碱基错误校正,获得碱基校正后的多个高质量测序序列;
组装模块,用于将从碱基校正模块获得的多个高质量测序序列进行基于冗余信息去除的组装处理,获得保留了原始遗传信息且去冗余信息测序序列的组装序列;以及
分析模块,用于将组装模块获得的保留了原始遗传信息且去冗余信息测序序列的组装序列与参考序列进行比对的,获得大片段插入或缺失的位置信息,
其中,所述组装模块包括:
比对单元,用于对比所述多条高质量测序序列的首尾碱基信息,得到各个高质量测序序列之间首尾交叠关系;
判断单元,用于分析比对单元获得的各个高质量测序序列之间首尾交叠关系,删除所述各个测序序列之间冗余的首尾交叠关系,得到所述各个高质量测序序列之间简化后的首尾交叠关系;
连接单元,用于根据判断单元得到的简化后的首尾交叠关系,对所述各个高质量测序序列进行组装,得到所述组装序列,使各个高质量测序序列只有单向的一条近邻序列。
7.一种计算机可读介质,其上存储有计算机程序,当在计算机上执行时,执行步骤包括:
将待测样本目标区域的多条基因测序序列进行筛选以及碱基错误校正处理,获得待测样本目标区域的多条高质量测序序列;
对待测样本目标区域的多条高质量测序序列进行基于冗余信息去除的组装处理,获得保留了原始遗传信息且去冗余信息测序序列的组装序列;
将所述组装序列与参考序列进行比对,根据比对结果获得大片段插入或缺失的位置信息;
其中,所述待测样本目标区域是利用人类参考基因组中的外显子区域或癌症相关的基因区域得到的,
所述的基于冗余信息去除的组装处理包括以下执行步骤:
对比所述多条高质量测序序列的首尾碱基信息,得到各个高质量测序序列之间首尾交叠关系;
通过对所述各个高质量测序序列之间首尾交叠关系的分析,删除所述各个测序序列之间冗余的首尾交叠关系,得到所述各个高质量测序序列之间简化后的首尾交叠关系;
根据所述简化的首尾交叠关系,对所述各个高质量测序序列进行组装,得到所述组装序列,使各个高质量测序序列只有单向的一条近邻序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于至本医疗科技(上海)有限公司;至本医疗科技江苏有限公司,未经至本医疗科技(上海)有限公司;至本医疗科技江苏有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710190589.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电磁铁自动测试设备
- 下一篇:一种纺织纱管在线分拣装置