[发明专利]一种大片段插入或缺失的预测方法及系统有效

专利信息
申请号: 201710190589.X 申请日: 2017-03-28
公开(公告)号: CN106951731B 公开(公告)日: 2019-04-12
发明(设计)人: 陈丽娟;王凯;秦公炜 申请(专利权)人: 至本医疗科技(上海)有限公司;至本医疗科技江苏有限公司
主分类号: G16B30/00 分类号: G16B30/00;G16B25/20
代理公司: 上海百一领御专利代理事务所(普通合伙) 31243 代理人: 王奎宇;马菁平
地址: 200120 上海市浦东新区中国*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 片段 插入 缺失 预测 方法 系统
【权利要求书】:

1.一种大片段插入或缺失的预测方法,其特征在于,包括:

将待测样本目标区域的多条基因测序序列进行筛选以及碱基错误校正处理,获得待测样本目标区域的多条高质量测序序列;

对待测样本目标区域的多条高质量测序序列进行基于冗余信息去除的组装处理,获得保留了原始遗传信息且去冗余信息测序序列的组装序列;

将所述组装序列与参考序列进行比对,根据比对结果获得大片段插入或缺失的位置信息;

其中,所述待测样本目标区域是利用人类参考基因组中的外显子区域或癌症相关的基因区域得到的;

所述的基于冗余信息去除的组装处理包括:

对比所述多条高质量测序序列的首尾碱基信息,得到各个高质量测序序列之间首尾交叠关系;

通过对所述各个高质量测序序列之间首尾交叠关系的分析,删除所述各个测序序列之间冗余的首尾交叠关系,得到所述各个高质量测序序列之间简化后的首尾交叠关系;

根据所述简化的首尾交叠关系,对所述各个高质量测序序列进行组装,得到所述组装序列,使各个高质量测序序列只有单向的一条近邻序列。

2.如权利要求1所述的方法,其特征在于,所述利用人类参考基因组中的外显子区域或癌症相关的基因区域得到待测样本目标区域包括:

对人类参考基因组中的外显子区域或癌症相关的基因区域进行目标筛选,获得包含人类参考基因组中的所有外显子区域或所有癌症相关的基因区域的靶向基因库;

根据所述靶向基因库设计探针,将其与待测样本进行杂交,获得目标区域范围内的待测样本DNA片段;

对所述目标区域范围内的待测样本DNA片段进行建库和测序后,得到待测样本目标区域的多条基因测序序列。

3.如权利要求1所述的方法,其特征在于,所述将待测样本目标区域的多条基因测序序列进行筛选包括:

去掉含有接头序列的所述测序后的基因序列;

根据设置的碱基质量阈值,去除低于碱基质量阈值的测序后的基因序列。

4.如权利要求1所述的方法,其特征在于,所述将待测样本目标区域的多条基因测序序列进行碱基错误校正处理是将每条测序序列进行修正使序列上每一个k-mer均为高频。

5.如权利要求1所述方法,其特征在于,所述大片段是长度≥10bp的基因片段。

6.一种预测大片段插入或缺失的系统,其特征在于,包括:

筛选模块,用于筛选待测样本目标区域的多条基因测序序列,获得筛选后的多条基因测序序列;

碱基校正模块,用于将从筛选模块筛选获得的多条测序序列进行碱基错误校正,获得碱基校正后的多个高质量测序序列;

组装模块,用于将从碱基校正模块获得的多个高质量测序序列进行基于冗余信息去除的组装处理,获得保留了原始遗传信息且去冗余信息测序序列的组装序列;以及

分析模块,用于将组装模块获得的保留了原始遗传信息且去冗余信息测序序列的组装序列与参考序列进行比对的,获得大片段插入或缺失的位置信息,

其中,所述组装模块包括:

比对单元,用于对比所述多条高质量测序序列的首尾碱基信息,得到各个高质量测序序列之间首尾交叠关系;

判断单元,用于分析比对单元获得的各个高质量测序序列之间首尾交叠关系,删除所述各个测序序列之间冗余的首尾交叠关系,得到所述各个高质量测序序列之间简化后的首尾交叠关系;

连接单元,用于根据判断单元得到的简化后的首尾交叠关系,对所述各个高质量测序序列进行组装,得到所述组装序列,使各个高质量测序序列只有单向的一条近邻序列。

7.一种计算机可读介质,其上存储有计算机程序,当在计算机上执行时,执行步骤包括:

将待测样本目标区域的多条基因测序序列进行筛选以及碱基错误校正处理,获得待测样本目标区域的多条高质量测序序列;

对待测样本目标区域的多条高质量测序序列进行基于冗余信息去除的组装处理,获得保留了原始遗传信息且去冗余信息测序序列的组装序列;

将所述组装序列与参考序列进行比对,根据比对结果获得大片段插入或缺失的位置信息;

其中,所述待测样本目标区域是利用人类参考基因组中的外显子区域或癌症相关的基因区域得到的,

所述的基于冗余信息去除的组装处理包括以下执行步骤:

对比所述多条高质量测序序列的首尾碱基信息,得到各个高质量测序序列之间首尾交叠关系;

通过对所述各个高质量测序序列之间首尾交叠关系的分析,删除所述各个测序序列之间冗余的首尾交叠关系,得到所述各个高质量测序序列之间简化后的首尾交叠关系;

根据所述简化的首尾交叠关系,对所述各个高质量测序序列进行组装,得到所述组装序列,使各个高质量测序序列只有单向的一条近邻序列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于至本医疗科技(上海)有限公司;至本医疗科技江苏有限公司,未经至本医疗科技(上海)有限公司;至本医疗科技江苏有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710190589.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top