[发明专利]异常组织中单样本体细胞突变位点检测方法、装置和存储介质有效
申请号: | 201710779843.X | 申请日: | 2017-09-01 |
公开(公告)号: | CN107491666B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 王佳茜;高志博;陈超;李淼;杨洁 | 申请(专利权)人: | 深圳裕策生物科技有限公司 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B30/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 孙银行;彭家恩 |
地址: | 518172 广东省深圳市龙岗区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 组织 样本 体细胞 突变 检测 方法 装置 存储 介质 | ||
一种异常组织中单样本体细胞突变位点检测方法、装置和存储介质,所述方法包括:获取异常样本和模拟的正常样本的有效测序序列;在上述有效测序序列中,对异常样本与模拟的正常样本不一致的碱基,根据突变碱基频率判断异常样本和模拟的正常样本的碱基型,然后用Fisher精确检验碱基型的差异,根据差异判断突变类型;以及通过对突变类型过滤去除假阳性变异和生殖细胞突变,得到高可信度的体细胞突变位点。所述方法具有高灵敏度、高特异性的特点,不仅对已知突变基因的突变检测具有比较高的灵敏度,而且能够找到新的突变基因。
技术领域
本发明涉及突变检测技术领域,具体涉及一种异常组织中单样本体细胞突变位点检测方法、装置和存储介质。
背景技术
基因组测序技术为癌症研究提供新的方向和契机,近几十年来,研究者通过测序技术发现了大量新的肿瘤驱动基因(driver gene),加速了癌症分子标记物的发现和个体化医疗的进程。常规的实验设计是同时收集肿瘤样本和对照样本,通过比较肿瘤样本和对照样本之间的差异,找到体细胞突变(somatic mutation)。这是理想的实验设计方案,但实际上有部分肿瘤组织很难取到对照样本或在保存的过程中丢失了对照样本,这部分样本仍然具有很高的研究价值,因此针对非成对样本的体细胞突变检测就十分关键。
目前针对肿瘤体细胞突变的检测大部分都是基于成对样本开发的,例如常用的samtools、varscan、GATK等软件。Broad开发的mutect软件虽然有单样本模式的体细胞变异检测,但效果不尽如人意,假阳性率高达99%以上。由此可见,目前基于非成对样本的体细胞突变检测方法有很大的挑战,如何识别生殖遗传突变是关键,但是目前的数据库无论是人类多态性遗传位点数据库dbSNP(https://www.ncbi.nlm.nih.gov/projects/SNP/)还是千人基因组计划发布的多态性数据库(http://www.internationalgenome.org)都无法包含人类所有的生殖遗传突变信息,因此需要借助其它信息来过滤掉生殖遗传突变。
发明内容
本发明提供一种异常组织中单样本体细胞突变位点检测方法、装置和存储介质,应用简单模型,具有高灵敏度、高特异性的特点,不仅对已知突变基因的突变检测具有比较高的灵敏度,而且能够找到新的突变基因。
根据第一方面,一种实施例中提供一种异常组织中单样本体细胞突变位点检测方法,包括如下步骤:
获取异常样本和模拟的正常样本的有效测序序列;
在上述有效测序序列中,对上述异常样本与上述模拟的正常样本不一致的碱基,根据突变碱基频率判断上述异常样本和上述模拟的正常样本的碱基型,然后用Fisher精确检验碱基型的差异,根据上述差异判断突变类型;和
通过对上述突变类型过滤去除假阳性变异和生殖细胞突变,得到高可信度的体细胞突变位点。
进一步地,上述异常样本是肿瘤样本。
上述获取异常样本和模拟的正常样本的有效测序序列之前,还包括将上述异常样本和模拟的正常样本的测序序列分别比对至参考基因组进行数据预处理的步骤;
进一步地,上述数据预处理包括如下至少一项:
过滤掉非目标物种基因组序列和测序重复序列;
过滤掉序列比对质量值小于预设值的序列,优选地,上述预设值是1;
保留重叠区域内两条成对序列中质量值较高的序列;和
过滤掉截断比对的序列、错配碱基富集的序列和比对有空隙的序列。
进一步地,上述根据突变碱基频率判断上述异常样本和上述模拟的正常样本的碱基型包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳裕策生物科技有限公司,未经深圳裕策生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710779843.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于生物信息评估的方法
- 下一篇:一种资源转移方法、终端、服务器和系统