[发明专利]检测染色体拷贝数异常的方法、装置和存储介质有效
申请号: | 201810651441.6 | 申请日: | 2018-06-22 |
公开(公告)号: | CN109192246B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 孙亚洲;肖贡;陈斌;杜刘稳;牛团结;陈杰 | 申请(专利权)人: | 深圳市达仁基因科技有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 染色体 拷贝 异常 方法 装置 存储 介质 | ||
1.一种检测染色体拷贝数异常的方法,其特征在于,所述方法包括:
获取待检测的样本的测序数据作为待检测数据,确定所述待检测数据对应的目标物种;
获取靶点数据库中存储的目标物种包含的每个染色体对应的特异性k-mer,所述特异性k-mer为每个染色体中的满足预设特异性条件的k-mer,所述k-mer是指长度为k的基因组序列;
获取每个染色体中包含的特异性k-mer在所述待检测数据中的实际出现次数;
从所述靶点数据库中获取到每个特异性k-mer的拷贝数,所述拷贝数是所述特异性k-mer在对应的染色体中的出现次数与该染色体上出现次数最少的特异性k-mer的出现次数的比值;
根据每个特异性k-mer的实际出现次数和拷贝数计算得到对应的染色体的实际信号强度;
将所述实际信号强度不在对应染色体的标准置信区间内的染色体判定为存在拷贝数异常的染色体。
2.根据权利要求1所述的方法,其特征在于,所述根据每个特异性k-mer的实际出现次数和拷贝数计算得到对应的染色体的实际信号强度,包括:
计算每个特异性k-mer的实际出现次数与拷贝数的比值;
计算每个染色体包含的所有特异性k-mer的所述比值的均值,作为对应的染色体的单拷贝信号强度;
根据每个染色体的单拷贝信号强度计算得到对应的染色体的实际信号强度。
3.根据权利要求2所述的方法,其特征在于,根据如下公式计算得到对应的染色体的实际信号强度:
染色体的实际信号强度=(染色体的单拷贝信号强度-M)/SD,其中M为全部的染色体的单拷贝信号强度的平均值,SD为全部的染色体的单拷贝信号强度的方差。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取预设数量的标准检测样本,所述标准检测样本是确认为无染色体拷贝数异常的样本;
获取所述标准检测样本中每个染色体包含的特异性k-mer在所述待检测数据中的实际出现次数;
从靶点数据库中获取到所述标准检测样本中包含的每个染色体中每个特异性k-mer的拷贝数;
根据所述标准检测样本中包含的每个特异性k-mer的实际出现次数和拷贝数得到对应的染色体的标准信号强度;
根据多个标准检测样本中的每个染色体的标准信号强度确定所述染色体在预设置信度值时对应的标准置信区间;
根据每个染色体对应的标准置信区间,获得所述目标物种中包含的染色体对应的标准置信区间列表。
5.根据权利要求4所述的方法,其特征在于,所述根据多个标准检测样本中的每个染色体的标准信号强度确定所述染色体在预设置信度值时对应的标准置信区间,包括:
获取每个所述标准检测样本包含的每个染色体的标准信号强度;
根据所述标准检测样本的性别分别计算所有标准检测样本中包含的染色体的标准信号强度的均值和方差;
根据每个染色体在相应性别的多个标准检测样本中的标准信号强度的均值和方差,确定每个性别对应的标准检测样本中包含的染色体在所述预设置信度值时对应的标准置信区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市达仁基因科技有限公司,未经深圳市达仁基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810651441.6/1.html,转载请声明来源钻瓜专利网。