[发明专利]检测目标区域CNV的方法及装置有效
申请号: | 202010319303.5 | 申请日: | 2020-04-21 |
公开(公告)号: | CN111508559B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 曹善柏;陈利斌;郭璟;楼峰 | 申请(专利权)人: | 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B50/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 路秀丽 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 目标 区域 cnv 方法 装置 | ||
本发明提供了一种检测目标区域CNV的方法及装置。该方法包括分别获取多个对照样本和待测样本的目标区域的测序数据,记为对照数据和待测数据;从对照数据中筛选出测序深度的大小关系全部保持一致的两个外显子,记作参照成对外显子,两者测序深度的大小关系记作参照关系,所有参照成对外显子的参照关系构成了参照关系谱;按照参照关系谱,检测待测数据中参照成对外显子的测序深度的大小关系,记为待测关系;检测待测关系与参照关系不一致的次数是否存在显著多次,若存在显著多次,则判定待测样本的目标区域发生CNV,反之,不发生。该方法避免了现有方法中对测序数据进行标准化处理而导致数据敏感性降低以及检测结果稳定性差的问题。
技术领域
本发明涉及基因测序数据分析领域,具体而言,涉及一种检测目标区域CNV的方法及装置。
背景技术
CNV(Copy number variation,拷贝数变异)根据大小可分为两个层次:显微水平(microscopic)和亚显微水平(submicroscopic)。显微水平的基因组结构变异主要是指显微镜下可见的染色体畸变,包括整倍体或非整倍体、缺失、插入、倒位、易位、脆性位点等结构变异。亚微水平的基因组结构变异是指DNA片段长度在1Kb-3Mb的基因组结构变异,包括缺失、插入、重复等,这些统称为CNV。
目前检测CNV的主要方法包括低通量分子生物学实验技术和高通量二代测序技术(NGS)。低通量分子生物学实验技术包括染色体显带技术、荧光原位杂交技术(FISH)和微滴式数字PCR(ddPCR)。这些技术的主要缺陷包括:分辨率低、操作复杂、检测通量低且受人为因素影响较大。相比之下,二代测序技术在肿瘤组织样本CNV检测上具有较高的敏感性,但分析过程复杂,严重依赖于算法设计,目前存在的算法包括:CNVkit,Control-FreeC和contra。
CNVkit:输出的结果没有进行统计学模型检验,没有明确的统计学意义。对于长度较大的基因,会出现将一个基因分成多个片段,且容易产生不同的CNV状态和拷贝数目不一致情况。另外该算法没有一个明确的阈值对是否发生CNV进行定性。
Control-FreeC:该算法适用于全基因组测序和全外显子测序,对于目前区域测序数据检测效果不理想。尤其对于外显子级别的检测敏感性较低。
综上可知,现有技术中尚无对区域测序数据中的CNV进行有效分析的方案。
发明内容
本发明的主要目的在于提供一种检测目标区域CNV的方法及装置,以解决现有技术中难以对来源于目标区域的测序数据中的CNV进行有效检测的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种检测目标区域CNV的方法,该方法包括:获取多个对照样本的目标区域的测序数据记为对照数据,同时获取待测样本的目标区域的测序数据,记为待测数据;从多个对照样本的对照数据中筛选出测序深度的大小关系全部保持一致的两个外显子,记作参照成对外显子,参照成对外显子的测序深度的大小关系记作参照关系,所有参照成对外显子及参照成对外显子的参照关系构成了参照关系谱;按照参照关系谱,检测待测数据中参照成对外显子的测序深度的大小关系,记为待测关系;检测待测关系与参照关系不一致的次数是否存在显著多次,若存在显著多次,则判定待测样本的目标区域发生CNV,反之,不发生。
进一步地,获取多个对照样本的目标区域的测序数据记为对照数据,同时获取待测样本的目标区域的测序数据,记为待测数据包括:获取多个对照样本的目标区域的测序数据,并将测序数据与参考基因组序列进行比对,得到唯一比对序列,记为对照数据;获取待测样本的目标区域的测序数据,并将测序数据与参考基因组序列进行比对,得到唯一比对序列,记为待测数据。
进一步地,在获得对照数据之后,以及从多个对照样本的对照数据中筛选出测序深度的大小关系全部保持一致的两个外显子之前,方法还包括:利用对照数据计算各外显子的测序深度,测序深度为覆盖外显子的碱基数与外显子长度的比值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司,未经北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010319303.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种秸秆焚烧排放清单估算方法
- 下一篇:数据库主从切换的方法、终端及存储介质