[发明专利]检测基因重排的方法与装置在审
申请号: | 201911144339.8 | 申请日: | 2019-11-20 |
公开(公告)号: | CN110942807A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 陈利斌;郭璟;楼峰;曹善柏 | 申请(专利权)人: | 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司 |
主分类号: | G16B25/00 | 分类号: | G16B25/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 路秀丽 |
地址: | 100176 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 基因 重排 方法 装置 | ||
本发明提供了一种检测基因重排的方法与装置。该方法包括获取待测样本的测序数据、待测的重排基因列表及人参考基因组转录本信息;利用待测的重排基因列表及人参考基因组转录本信息,构建基因列表相关的第一kmers哈希表;对测序数据中的每对read构建第二kmers哈希表;根据第一kmers哈希表与第二kmers哈希表进行对应,获得基因与read对的映射关系集群;统计映射关系集群中的read对的覆盖宽度,筛选覆盖宽度最大的基因重排基因对作为候选的基因重排基因对;对候选的基因重排基因对进行过滤,得到目标重排基因对。该方法降低了降低检出基因重排事件的假阳性,提高了检测算法的敏感性。
技术领域
本发明涉及基因测序数据分析领域,具体而言,涉及一种检测基因重排的方法与装置。
背景技术
目前,基于二代测序技术检测重排的方法基本都是如下思路:先将待比对序列与人参考基因组进行比对,得到异常比对序列。根据异常比对序列在参考基因组上的比对位置和方向,确定断点位置。利用待比对序列中支持候选断点的位置序列进行组装,保留组装结果中与候选断点的位置序列信息一致的断点,从而确定基因重排。
然而,现有检测方法中容易出现假阳性的基因重排结果,因而影响检测准确性。
发明内容
本发明的主要目的在于提供一种检测基因重排的方法与装置,以解决现有技术中对基因重排检测容易出现假阳性的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种检测基因重排的方法,该方法包括:获取待测样本的测序数据、待测的重排基因列表及人参考基因组转录本信息;利用待测的重排基因列表及人参考基因组转录本信息,构建基因列表相关的第一kmers哈希表;对测序数据中的每对read构建第二kmers哈希表;根据第一kmers哈希表与第二kmers哈希表进行对应,获得基因与read对的映射关系集群;统计映射关系集群中的read对的覆盖宽度,筛选覆盖宽度最大的基因重排基因对作为候选的基因重排基因对;对候选的基因重排基因对进行过滤,得到目标重排基因对。
进一步地,对测序数据中的每对read构建第二kmers哈希表之前,该方法还包括:对测序数据中的每条read进行复杂度筛选,并保留复杂度满足阈值的read;优选阈值为大于等于0.3的值。
进一步地,对候选的基因重排基因对进行过滤包括:按照如下至少之一的条件对候选的基因重排基因对进行过滤:1)如果候选的基因重排基因对的两个基因来自同一条染色体,则两个基因之间至少相距100000bp;2)同一个基因出现的候选的基因重排基因对的数量小于等于5;3)候选的基因重排基因对有大于等于2对read支持。
进一步地,该方法还包括对目标重排基因对进行注释,优选注释包括HGVS注释和/或COMSIC注释。
进一步地,该方法还包括对目标重排基因的重排事件进行可视化展示。
为了实现上述目的,根据本发明的一个方面,提供了一种检测基因重排的装置,该装置包括:获取模块、第一构建模块、第二构建模块、映射模块、统计筛选模块及过滤模块,获取模块,用于获取待测样本的测序数据、待测的重排基因列表及人参考基因组转录本信息;第一构建模块,用于利用待测的重排基因列表及人参考基因组转录本信息,构建基因列表相关的第一kmers哈希表;第二构建模块,用于对测序数据中的每对read构建第二kmers哈希表;映射模块,用于根据第一kmers哈希表与第二kmers哈希表进行对应,获得基因与read对的映射关系集群;统计筛选模块,用于统计映射关系集群中的read对的覆盖宽度,筛选覆盖宽度最大的基因重排基因对作为候选的基因重排基因对;过滤模块,用于对候选的基因重排基因对进行过滤,得到目标重排基因对。
进一步地,装置还包括:复杂度筛选模块,用于对测序数据中的每条read进行复杂度筛选,并保留复杂度满足阈值的read;优选阈值为大于等于0.3的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司,未经北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911144339.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:设备的拼接系统和方法
- 下一篇:一种防倾斜的电视机及其使用方法