[发明专利]核基因组拷贝数变异检测方法及装置、设备、存储介质在审
申请号: | 202210862798.5 | 申请日: | 2022-07-20 |
公开(公告)号: | CN115331730A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 赵哲;韩雪莹;韦晨曦;申剑峰;刘学 | 申请(专利权)人: | 郑州金域临床检验中心有限公司 |
主分类号: | G16B20/10 | 分类号: | G16B20/10;G16B20/20;G16B40/30 |
代理公司: | 广州广典知识产权代理事务所(普通合伙) 44365 | 代理人: | 王东平 |
地址: | 475002 河南省河南自贸试验区*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因组 拷贝 变异 检测 方法 装置 设备 存储 介质 | ||
本发明属于生物信息检测技术领域,公开了一种核基因组拷贝数变异检测方法,能够识别待测样本是否为女性样本,若是,利用其X染色体位点的测序深度值的一半数值以及常染色体位点的测序深度值与各自的置信区间进行比对,确定出拷贝异常位点,计算拷贝异常位点的拷贝数值进行空间聚类分类,获得正常拷贝类和拷贝变异类;将归属于拷贝变异类的拷贝异常位点确定为拷贝变异位点;接着将位置相邻且同变异类型的拷贝变异位点合并得到CNV片段,因此本发明能够自动并准确进行所有核基因组染色体的CNV检测,提高对性染色体CNV检测的准确性;同时在提高RD位点分辨率的同时保证CNV片段的稳定性、准确性和灵敏度。
技术领域
本发明属于生物信息检测技术领域,具体涉及一种核基因组拷贝数变异检测方法及装置、设备、存储介质。
背景技术
宏基因临床检测技术是利用二代高通量测序从遗传物质角度对微生物感染进行鉴定和诊断的新型临床技术。其中高通量测序数据包含的微生物序列 (即非人源性序列)相对有限,超过90%的序列内容为人源性序列。但至今的临床应用中却仅使用了量较少的微生物序列进行感染学鉴定,量较多的人源性序列依然缺少应用和分析。宏基因技术利用游离核酸进行微生物鉴定,而肿瘤细胞因其高代谢率容易在游离核酸中检测到,游离核酸已经成为肿瘤筛查和检查的重要实验样本。如果通过宏基因在感染学检测的同时进行肿瘤或遗传病早筛检测,不但能够解决当前疾病问题,还能对肿瘤或遗传病早筛阳性结果提前介入和治疗,对人类健康有着巨大意义。但至今却极少联合宏基因和肿瘤基因拷贝数变异(Copy Number Variations,CNV)检测的算法和软件。因此通过宏基因感染的检测手段能够同时进行肿瘤或遗传病筛查的工作受技术限制无法进行。
目前针对CNV检测的主流理论包括Read-Pair(RP)法、Split-read(SR)法、 Read-Depth(RD)法和Assembly(AS)法等4种方法。其中RP是最早出现的算法,利用双端测序插入片段长度分布来检测CNV,也称之为pair end mapping(PEM) 方法。当插入片段长度过长或者过短时,都代表着基因组发生了结构变异。SR 方法利用一端能够比对,另外一端比对不上的reads来识别CNV。另外一端比对不上,可能是存在CNV,通过将单独的reads进行拆分,使其能够正确比对到参考基因组上,拆分的点就是CNV的断裂点。RD方法利用拷贝数和对应区域测序深度的相关性来进行分析,基本模型是缺失区域的测序深度相对低,而插入区域的测序深度相对高。AS方法利用测序得到的短序列进行组装,将组装的contig与参考基因组进行比较,从而确定发生了结构变异的区域。
由于宏基因检测为50-75bp的二代单端测序技术,与当前主流软件均不相符,同时地区人群位点、不同实验条件引入的位点差异均无法得到很好的矫正,使得其分辨率和结果在目前的软件中均表现不佳,至今仍无可用于宏基因CNV 检测的算法。针对CNV检测主流理论,RP和SR两种方法依赖于双端测序技术,不适用于宏基因数据,且相对算法不够精确。AS法依赖通量和测序覆盖度技术,宏基因的覆盖度与基因组组装技术相差甚远,该方法无法运行于宏基因数据。这三种理论方法均与宏基因测序数据不符合,仅RD法下的少量软件可以应用。
但是RD法依赖通量和测序深度技术,需要较高较稳定的深度变化才能用于识别CNV,因此在宏基因这种低测序深度的数据中应用该方法会引入极多的假阳性位点。且传统RD法分析模型使用相同的RD分辨率和CNV分辨率,过小的分辨率会导致数据离散型太强,假阳性过高,过大的分辨率会导致CNV 平均化,产生假阴性结果,同时CNV的边缘位置也可能因为RD计算时的区间覆盖形成过渡型,影响CNV的识别和判断,因此导致CNV检测的准确性、灵敏度均不够。
此外目前的CNV检测工具进行遗传病早筛都需要输入大量的辅助信息,包括但不限于变异组和正常组信息、患者性别、步长、染色体区段、参考索引等。其中对于性染色体CNV变异识别策略,第一种是基于自身与常染色体的直接深度对照,第二种是依赖手动输入参数进行性别分群分析。第一种策略只能进行单样本检测,假阳性较多,不够准确。第二种策略需要手动输入参数,相对复杂。然而临床测序数据相对复杂,辅助信息不明确,检测效率较低。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州金域临床检验中心有限公司,未经郑州金域临床检验中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210862798.5/2.html,转载请声明来源钻瓜专利网。