[发明专利]检测基因重排的方法与装置在审

专利信息
申请号: 201911144339.8 申请日: 2019-11-20
公开(公告)号: CN110942807A 公开(公告)日: 2020-03-31
发明(设计)人: 陈利斌;郭璟;楼峰;曹善柏 申请(专利权)人: 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司
主分类号: G16B25/00 分类号: G16B25/00
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 路秀丽
地址: 100176 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 检测 基因 重排 方法 装置
【说明书】:

发明提供了一种检测基因重排的方法与装置。该方法包括获取待测样本的测序数据、待测的重排基因列表及人参考基因组转录本信息;利用待测的重排基因列表及人参考基因组转录本信息,构建基因列表相关的第一kmers哈希表;对测序数据中的每对read构建第二kmers哈希表;根据第一kmers哈希表与第二kmers哈希表进行对应,获得基因与read对的映射关系集群;统计映射关系集群中的read对的覆盖宽度,筛选覆盖宽度最大的基因重排基因对作为候选的基因重排基因对;对候选的基因重排基因对进行过滤,得到目标重排基因对。该方法降低了降低检出基因重排事件的假阳性,提高了检测算法的敏感性。

技术领域

本发明涉及基因测序数据分析领域,具体而言,涉及一种检测基因重排的方法与装置。

背景技术

目前,基于二代测序技术检测重排的方法基本都是如下思路:先将待比对序列与人参考基因组进行比对,得到异常比对序列。根据异常比对序列在参考基因组上的比对位置和方向,确定断点位置。利用待比对序列中支持候选断点的位置序列进行组装,保留组装结果中与候选断点的位置序列信息一致的断点,从而确定基因重排。

然而,现有检测方法中容易出现假阳性的基因重排结果,因而影响检测准确性。

发明内容

本发明的主要目的在于提供一种检测基因重排的方法与装置,以解决现有技术中对基因重排检测容易出现假阳性的问题。

为了实现上述目的,根据本发明的一个方面,提供了一种检测基因重排的方法,该方法包括:获取待测样本的测序数据、待测的重排基因列表及人参考基因组转录本信息;利用待测的重排基因列表及人参考基因组转录本信息,构建基因列表相关的第一kmers哈希表;对测序数据中的每对read构建第二kmers哈希表;根据第一kmers哈希表与第二kmers哈希表进行对应,获得基因与read对的映射关系集群;统计映射关系集群中的read对的覆盖宽度,筛选覆盖宽度最大的基因重排基因对作为候选的基因重排基因对;对候选的基因重排基因对进行过滤,得到目标重排基因对。

进一步地,对测序数据中的每对read构建第二kmers哈希表之前,该方法还包括:对测序数据中的每条read进行复杂度筛选,并保留复杂度满足阈值的read;优选阈值为大于等于0.3的值。

进一步地,对候选的基因重排基因对进行过滤包括:按照如下至少之一的条件对候选的基因重排基因对进行过滤:1)如果候选的基因重排基因对的两个基因来自同一条染色体,则两个基因之间至少相距100000bp;2)同一个基因出现的候选的基因重排基因对的数量小于等于5;3)候选的基因重排基因对有大于等于2对read支持。

进一步地,该方法还包括对目标重排基因对进行注释,优选注释包括HGVS注释和/或COMSIC注释。

进一步地,该方法还包括对目标重排基因的重排事件进行可视化展示。

为了实现上述目的,根据本发明的一个方面,提供了一种检测基因重排的装置,该装置包括:获取模块、第一构建模块、第二构建模块、映射模块、统计筛选模块及过滤模块,获取模块,用于获取待测样本的测序数据、待测的重排基因列表及人参考基因组转录本信息;第一构建模块,用于利用待测的重排基因列表及人参考基因组转录本信息,构建基因列表相关的第一kmers哈希表;第二构建模块,用于对测序数据中的每对read构建第二kmers哈希表;映射模块,用于根据第一kmers哈希表与第二kmers哈希表进行对应,获得基因与read对的映射关系集群;统计筛选模块,用于统计映射关系集群中的read对的覆盖宽度,筛选覆盖宽度最大的基因重排基因对作为候选的基因重排基因对;过滤模块,用于对候选的基因重排基因对进行过滤,得到目标重排基因对。

进一步地,装置还包括:复杂度筛选模块,用于对测序数据中的每条read进行复杂度筛选,并保留复杂度满足阈值的read;优选阈值为大于等于0.3的值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司,未经北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911144339.8/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top