[发明专利]一种同源重组修复缺陷的评估方法、装置和存储介质有效
申请号: | 202111572513.6 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114242170B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 黄毅;朱彬彬;陈华东;刘久成;刘青峰;易鑫;杨玲 | 申请(专利权)人: | 深圳吉因加医学检验实验室 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B25/20;G16B20/30;G16B40/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 李小焦;彭家恩 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 同源 重组 修复 缺陷 评估 方法 装置 存储 介质 | ||
1.一种同源重组修复缺陷的评估方法,其特征在于:包括以下步骤,
全基因组测序数据获取和比对步骤,包括获取待测样本的低深度全基因组测序下机数据,去除接头,将其比对到参考基因组上,根据比对排序过滤PCR产生的重复序列,获得比对文件;
全基因组测序数据质控步骤,包括对所述比对文件进行质量分析,获得包括比对率、测序深度、GC含量和重复率在内的质量信息,根据质量信息过滤获取合格的测序数据;
污染数据过滤步骤,包括对测序数据进行污染率分析,分析其受污染情况,获取污染率小于污染率阈值的测序数据;
拷贝数变异分析步骤,包括采用ACE软件确定低深度全基因组测序样本的肿瘤纯度,并且生成total CNA谱,所述total CNA谱包含样本名、染色体、起始位置、终止位置、拷贝数和segments片段信息;
LST值计算步骤,包括根据所述total CNA谱计算样本的LST值,具体的,删除小于3M的segments片段,绘制segments片段密度分布图;取第一个局部最小值为CNAcutoff;若特定区间0.025到0.45之间不存在局部最小值,则将CNAcutoff设置为segments片段密度曲线第一个峰中出现的小拐点,通过降低CNA cutoff,使样本的LST增加;当相邻两个segments片段小于CNA cutoff,则将两个segments片段拟合;计算CNA cutoff的规则如下,若局部最小值大于0.025且小于0.45,取第一个局部最小值作为CNA cutoff;若局部最小值小于0.025时,取0.025作为CNA cutoff;若局部最小值大于0.45时,取0.45作为CNA cutoff;当局部最小值大于0.45时,且密度图在0.45之前出现导数值减小但未改变正负的小拐点时,计算0.025到0.45之间密度图的导数,导数的最小值对应的差值作为CNA cutoff;当相邻两个segments片段差值大于CNA cutoff,同时间隔小于3Mb,且长度均大于10Mb,则LST值加1;
待测样本全基因组复制分析步骤,包括判断待测样本是否发生全基因组复制,如果有发生全基因组复制,并且样本segments片段极差大于2,同时segments片段密度图中峰值个数大于4,则LST值减9,作为最终的LST值;
同源重组修复缺陷状态评估步骤,包括根据BRCA基因型别和最终的LST值判断同源重组修复缺陷状态为阳性或阴性;
所述待测样本全基因组复制分析步骤中,判断待测样本是否发生全基因组复制的方法包括,根据segments片段密度分布图,通过segments片段的极差情况判断样本是否发生全基因组复制,判断规则包括,
a.当样本segments片段极差小于1时,样本不发生全基因组复制;
b.当样本segments片段极差大于1,且峰值个数小于3时,样本不发生全基因组复制;
c.当样本segments片段极差大于1,且峰值个数大于或等于3时,样本发生全基因组复制;
d.当样本segments片段极差大于9,且峰值个数大于或等于2时,样本发生全基因组复制;
所述同源重组修复缺陷状态评估步骤中,判断同源重组修复缺陷状态的规则包括,当BRCA基因型别为突变型时,无论LST值如何,同源重组修复缺陷状态均判断为阳性;当BRCA基因型别为野生型时,LST值大于或等于HRD生物学阈值,则判断同源重组修复缺陷状态为阳性,否则为阴性;
所述HRD生物学阈值是以模型数据中BRCA突变样本中的95%均为HRD阳性确定的阈值。
2.根据权利要求1所述的评估方法,其特征在于:所述全基因组测序数据获取和比对步骤中,所述低深度全基因组测序是指测序深度不超过5。
3.根据权利要求1所述的评估方法,其特征在于:采用bwa-mem2软件将去除接头的序列比对到参考基因组hg19上。
4.根据权利要求1所述的评估方法,其特征在于:所述全基因组测序数据质控步骤中,比对率大于95%,深度大于0.8为合格。
5.根据权利要求1所述的评估方法,其特征在于:所述污染数据过滤步骤中,所述污染率阈值为使用群体性等位基因频率构建模型评估样本的污染率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳吉因加医学检验实验室,未经深圳吉因加医学检验实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111572513.6/1.html,转载请声明来源钻瓜专利网。