[发明专利]基于RNAseq数据的融合基因检测方法、装置和存储介质有效
申请号: | 202011098214.9 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112164423B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 吴玲清;刘久成;黄毅;易玉婷;杜新华;陈晨;陈振玺;戴平平;付骁睿 | 申请(专利权)人: | 深圳吉因加医学检验实验室 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 李小焦;彭家恩 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 rnaseq 数据 融合 基因 检测 方法 装置 存储 介质 | ||
1.一种基于RNAseq数据的融合基因检测方法,其特征在于:包括以下步骤,
数据质控步骤,包括对原始下机数据进行质控,评估有效比对数据量、外显子比对率、污染率情况;
融合基因检测软件筛选步骤,包括通过阳性标准品和阴性标准品的融合基因检出情况,对比若干个融合基因检测软件的性能,从中挑选最佳性能的融合基因检测软件用于后续使用;
支持读段过滤步骤,包括采用所述融合基因检测软件筛选步骤获得的融合基因检测软件对经过所述数据质控步骤处理的待测样品的RNAseq数据进行融合基因检测;保留热点融合基因列表,过滤假阳性融合基因列表;并针对阳性标准品和阴性标准品中假阳性融合检出情况,设置支持读段的过滤规则,降低假阳性检出比例;
外显子缺失融合突变分析步骤,包括统计支持所述基因发生融合突变的split reads和spanning reads的数目,通过split reads和spanning reads数目阈值判定是否存在外显子缺失。
2.根据权利要求1所述的融合基因检测方法,其特征在于:所述原始下机数据为全转录组测序数据或RNA探针捕获数据。
3.根据权利要求1所述的融合基因检测方法,其特征在于:所述数据质控步骤包括通过质量评估,筛选符合融合基因突变检测的样本,质量评估指标具体包括,
数据量预期下机数据量的90%;
基因组比对率85%;
外显子比对率35%;
剪接位点的读段总长(数据量×1×1/2);
污染率10%。
4.根据权利要求3所述的融合基因检测方法,其特征在于:所述污染率的评估,包括外源微生物污染和物种内样本间的交叉污染。
5.根据权利要求1所述的融合基因检测方法,其特征在于:所述融合基因检测软件筛选步骤中,具体对比了以下融合基因检测软件中的至少两个,Arriba、STAR-fusion、FusionCatcher、ChimeraScan、ChimPipe、deFuse、EricScript、FusionHunter、InFusion、JAFFA-Assembly、JAFFA-Direct、JAFFA-Hybrid、MapSplice、nFuse、Pizzly、PRADA、SOAP-fuse、STARChip、STAR-SEQR、TopHat-Fusion、TopHatFusion-C、TopHatFusion-D、TopHatFusion-UC。
6.根据权利要求1所述的融合基因检测方法,其特征在于:所述支持读段过滤步骤中,具体的,设置支持读段的过滤规则,使得阳性标准品和阴性标准品的检测灵敏度95%,假阳性比率为0。
7.根据权利要求6所述的融合基因检测方法,其特征在于:所述保留热点融合基因列表,具体包括,保留DNA融合变异位点信息和/或临床数据库及文献报道的已知热点融合基因;
优选的,所述过滤假阳性融合基因列表,具体包括,删除健康组织中存在的常见的比对伪影和转录本,包括邻近基因之间的通读融合、环状RNA和其他非正规剪接的转录本;
优选的,不考虑融合支持读段的过滤条件,强制保留DNA融合变异位点信息和/或临床数据库及文献报道的已知热点融合基因;并且,不考虑融合支持读段的过滤条件,强制过滤去除假阳性融合基因列表。
8.根据权利要求7所述的融合基因检测方法,其特征在于:对于热点融合基因的融合支持读段过滤规则为,2 ≤ split read1+split read2+spanning reads < 5或splitread1+split read2+spanning reads ≥ 5时,split read1、split read2、spanningreads至少两项不为0;对于非热点融合基因的融合支持读段过滤规则为,10 splitread1+split read2+spanning reads,且split read1、split read2、spanning reads至少两项不为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳吉因加医学检验实验室,未经深圳吉因加医学检验实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011098214.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种透明屏显示LED灯排列方式
- 下一篇:一种商品位置的引导方法以及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置