[发明专利]使用家系WES数据识别UPD的方法、装置及电子设备有效
申请号: | 202011336492.3 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112375829B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 鲍远亮;余伟师;梁萌萌;姜玥 | 申请(专利权)人: | 苏州赛美科基因科技有限公司 |
主分类号: | C12Q1/6888 | 分类号: | C12Q1/6888;C12Q1/68;G16B20/20 |
代理公司: | 南京九致知识产权代理事务所(普通合伙) 32307 | 代理人: | 严巧巧 |
地址: | 215100 江苏省苏州市相城区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 家系 wes 数据 识别 upd 方法 装置 电子设备 | ||
1.一种使用家系WES数据识别UPD的装置,其特征在于,包括单亲同二体iUPD区间获取单元和单亲异二体hUPD区间获取单元;
所述单亲同二体iUPD区间获取单元包括:
第一文件获取模块,用于获取家系WES样本的fastq文件,家系WES样本包括先证者及其父母;
第一变异检测模块,用于对家系WES样本的fastq文件进行单核苷酸变异SNP和拷贝数变异CNV检测,获得家系WES样本的VCF文件和CNV分析结果;
数据处理模块,用于根据家系WES样本的VCF文件,采用基因数据处理软件检测VCF文件中先证者的所有ROH区间,先对SNP位点进行测序深度过滤,再对所有ROH区间按照区间大小和所在染色体位置分别过滤,通过过滤条件的所有ROH区间构成第一ROH区间组,第一ROH区间组中任一ROH区间记为第一ROH区间;
第一过滤模块,用于根据非双亲遗传模式统计第一ROH区间组内每个第一ROH区间上有效位点数量和该第一ROH区间的ROH有效位点比例,并按照ROH有效位点比例过滤第一ROH区间组中第一ROH区间,所述过滤后的第一ROH区间组记为第二ROH区间组,第二ROH区间组中任一ROH区间记为第二ROH区间;所述有效位点为能够判断为单亲二倍体UPD遗传模式的位点,所述ROH有效位点比例为第一ROH区间上有效位点数量占第一ROH区间内SNP位点总数的比例;
第二过滤模块,用于对家系WES样本的VCF文件,过滤去除VCF文件中变异质量值小于50且SNP位点测序深度小于70的SNP位点,同时过滤去除VCF文件中indel位点,获得筛选过滤后的VCF文件;
第一差异分析模块,用于对筛选过滤后的VCF文件,统计先证者每条染色体上有效位点数量,并对所有染色体上有效位点数量进行差异分析,获得显著异常染色体;
获取模块,用于获取第二ROH区间组和显著异常染色体中共同检测出的所有第二ROH区间,构成第三ROH区间组,第三ROH区间组中任一ROH区间记为第三ROH区间;
第三过滤模块,用于从第三ROH区间组中过滤其与CNV分析结果共同检测出的缺失变异Deletion,过滤缺失变异Deletion后的第三ROH区间组中任一ROH区间即为单亲同二体iUPD区间;
所述单亲异二体hUPD区间获取单元包括:
第二文件获取模块,用于获取家系WES样本的fastq文件,家系WES样本包括先证者及其父母;
第二变异检测模块,用于对家系WES样本的fastq文件进行单核苷酸变异SNP检测,获得家系WES样本的VCF文件;
第三过滤模块,用于对家系WES样本的VCF文件,过滤去除VCF文件中变异质量值小于50且SNP位点测序深度小于70的SNP位点,同时过滤去除VCF文件中indel位点,获得筛选过滤后的VCF文件;
第二差异分析模块,用于对筛选过滤后的VCF文件,统计先证者每条染色体上有效位点数量,并对所有染色体上有效位点数量进行差异分析,获得显著异常染色体;所述有效位点为能够判断为单亲二倍体UPD遗传模式的位点;
测试模块,用于采用已知样本数量的hUPD阳性样本和iUPD阳性样本作为测试样本,统计任一测试样本区间的H值,H值为测试样本区间内单亲同二体iUPD遗传模式位点数量与单亲二倍体UPD遗传模式位点数量的比值,获取hUPD阳性样本的H值范围、iUPD阳性样本的H值范围;
验证模块,用于对任一测试样本采用染色体分割法统计单位区间内的H值,验证hUPD阳性样本的H值区间、iUPD阳性样本的H值区间的可靠性,并根据验证结果确定hUPD阳性样本区间的H值范围;
分割统计模块,用于采用染色体分割法将显著异常染色体分割为若干等大小的单位区间,统计每个单位区间内的有效位点数量,分别计算每个单位区间对应的H值;
判断合并模块,用于当单位区间对应的H值位于hUPD阳性样本区间的H值范围内,判断该单位区间为hUPD区间,并且当相邻单位区间的H值均位于hUPD阳性样本区间的H值范围内时,合并相邻单位区间并构成新的hUPD区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州赛美科基因科技有限公司,未经苏州赛美科基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011336492.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置