[发明专利]基于外显子测序数据的拷贝数变异检测方法及系统、终端和存储介质有效
申请号: | 202010038141.8 | 申请日: | 2020-01-14 |
公开(公告)号: | CN111210873B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 叶凯;梁皓;杨晓飞;杨帆;贾鹏;郭立 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B20/10 | 分类号: | G16B20/10;G16B20/20;G16B30/00;G16B40/00;G16B50/00;G06F17/16;G06F18/2135 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 马贵香 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 外显子测 序数 拷贝 变异 检测 方法 系统 终端 存储 介质 | ||
1.一种基于外显子测序数据的拷贝数变异检测方法,其特征在于,包括以下步骤:
S100,获取正常样本和测试样本,对正常样本的外显子测序数据进行数据清理,然后对数据进行标准化处理,生成标准化后的正常样本集数据矩阵;
S200,根据正常样本集数据矩阵中每个外显子区域在所有样本中的离散程度,将外显子区域划分成稳定与不稳定的区域;在稳定的区域中,处理测序技术中批次效应因素对正常样本集与测试样本比对的影响,以此构建参考数据矩阵;
S300,使用PCA方法对参考数据矩阵进行处理,通过用主成分重构原始数据,将参考数据矩阵转换到其他空间并得到新的参数;
S400,将测试数据变换到参考数据矩阵使用PCA转换后的空间中,然后使用Z-score方法得到测试数据与参考数据矩阵在当前空间中的差异程度,将外显子区域划分成扩增、正常、删除三种状态,根据各个外显子区域的状态使用贪心算法进行合并,完成对测试样本的拷贝数变异的检测。
2.根据权利要求1所述的一种基于外显子测序数据的拷贝数变异检测方法,其特征在于,步骤S100具体包括:
S101,根据样本集文件自身提供的质量信息对正常样本集的外显子测序数据进行质量控制,获得高质量的测序数据,形成正常样本集外显子测序数据对应的reads count数据矩阵;
S102,根据外显子测序数据自身的特点进行进一步清理,过滤掉数据矩阵中不符合参数值要求的外显子区域;
S103,对数据进行标准化处理,将每个样本每个外显子区域的reads数标准化后的值构建形成正常样本集数据矩阵。
3.根据权利要求1所述的一种基于外显子测序数据的拷贝数变异检测方法,其特征在于,S102中,所述参数值要求包括设定最低的外显子长度、外显子上可接受的最低GC含量、外显子上可接受的最高GC含量、所有样本在一个外显子上可接受的最低的reads数的中位数。
4.根据权利要求1所述的一种基于外显子测序数据的拷贝数变异检测方法,其特征在于,S103中,每个样本每个外显子区域的reads数标准化后的值为外显子上的reads数除以对应样本测序数据中的数据清理后的reads数总和。
5.根据权利要求1所述的一种基于外显子测序数据的拷贝数变异检测方法,其特征在于,步骤S200具体包括:
S201,使用变异系数判断正常样本集数据中每个外显子区域在所有样本中的离散程度,根据设定的变异系数阈值将外显子区域划分成稳定与不稳定的区域;
S202,将测试样本的外显子测序数据按照正常样本集数据矩阵的构建流程生成对应的测试样本数据矩阵,然后在稳定的外显子区域中计算测试样本与正常样本集之间的距离,进而生成参考数据矩阵。
6.一种基于外显子测序数据的拷贝数变异检测系统,其特征在于,包括:
正常样本集数据矩阵生产模块,用于获取正常样本和测试样本,对正常样本的外显子测序数据进行数据清理,然后对数据进行标准化处理,生成标准化后的正常样本集数据矩阵;
参考数据矩阵构建模块,用于根据正常样本集数据矩阵中每个外显子区域在所有样本中的离散程度,将外显子区域划分成稳定与不稳定的区域;在稳定的区域中,处理测序技术中批次效应因素对正常样本集与测试样本比对的影响,以此构建参考数据矩阵;
参考数据矩阵处理模块,使用PCA方法对参考数据矩阵进行处理,通过用主成分重构原始数据,将参考数据矩阵转换到其他空间并得到新的参数;
拷贝数变异的检测模块,将测试数据变换到参考数据矩阵使用PCA转换后的空间中,然后使用Z-score方法得到测试数据与参考数据矩阵在当前空间中的差异程度,将外显子区域划分成扩增、正常、删除三种状态,根据各个外显子区域的状态使用贪心算法进行合并,完成对测试样本的拷贝数变异的检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010038141.8/1.html,转载请声明来源钻瓜专利网。