[发明专利]数据处理方法、装置、存储介质及处理器有效
申请号: | 201711484713.X | 申请日: | 2017-12-29 |
公开(公告)号: | CN108229099B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 徐寒黎;王伟伟;张静波;刘珂弟;刘倩;唐宇 | 申请(专利权)人: | 北京科迅生物技术有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡 |
地址: | 100037 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 存储 介质 处理器 | ||
本发明公开了一种数据处理方法、装置、存储介质及处理器。其中,该方法包括:获取样本染色体上的基因序列;比对所述基因序列与人类基因组参考序列,确定所述样本染色体中与所述人类基因组参考序列唯一匹配的碱基序列reads;统计每个观测区域bin中所述碱基序列reads的数量,其中,所述观测区域bin为所述样本染色体按照预定分窗条件进行分窗后得到的多个区域bin;根据多个观测区域bin中所述碱基序列reads的数量确定隐马尔科夫模型;根据隐马尔科夫模型确定基因拷贝数变异CNV,其中,所述拷贝数变异CNV包括:至少一个观测区域bin。本发明解决了现有技术无法确定染色体异常诊断中干扰因素的技术问题。
技术领域
本发明涉及生物领域,具体而言,涉及一种数据处理方法、装置、存储介质及处理器。
背景技术
染色体异常是导致出生缺陷的重要原因,在众多染色体异常疾病中,胎儿染色体非整倍体病变是胎儿最常见的染色体畸形。因此,产前诊断可以在孕早期或中期就对胎儿做出诊断,以便进行提前干预或治疗,是降低出生缺陷、提高出生人口素质的重要手段。
目前,对于染色体异常的产前诊断通常分为非侵入性和侵入性两种手段。侵入性手段包括:绒毛活检术,羊膜穿刺术和经腹脐静脉穿刺术等等。虽然采用侵入性手段的诊断结果较准确,但是具有相当高的风险性,容易造成孕妇流产或宫内感染。产前筛查手段(外周血生化筛查和超声颈部透明带)虽然不使用侵入式方法,但是检测率和假阳率并不能达到期望的水平。
NIPT,简称无创产前检测,是应用于孕期产检的一项技术,这项技术是基于孕妇外周血血浆中存在游离胎儿DNA,具有很高的检测准确性,同时也避免了侵入性检测所带来的流产和宫内感染风险。
NIPT检测方法是利用假设检验Z-test来检测染色体异常。首先需要抽取孕妇外周血,分离出血浆,提取出血浆游离DNA,构建二代测序文库,利用二代测序仪得到孕妇血浆游离DNA的序列信息。让后将得到的测序数据通过基本的质控、和人类参考基因组HG19比对、GC校正、计算Z score等步骤来得到完成染色体异常诊断。
然而,由于参考基因组HG19是针对欧洲人的基因组参考序列,而对于中国孕妇人群会存在参考偏差(reference bias),从而导致染色体异常的产前诊断不够准确。
另外,母体自身存在的基因拷贝数变异CNV也会对胎儿的检测带来很大干扰,也会影响诊断的准确性。
由于现有技术无法确定染色体异常诊断中干扰因素,进而无法取出干扰因素,从而导致染色体异常诊断的不够准确。
针对现有技术无法确定染色体异常诊断中干扰因素的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据处理方法、装置、存储介质及处理器,以至少解决现有技术无法确定染色体异常诊断中干扰因素的技术问题。
根据本发明实施例的一个方面,提供了一种数据处理方法,该方法包括:获取样本染色体上的基因序列;比对所述基因序列与人类基因组参考序列,确定所述样本染色体中与所述人类基因组参考序列唯一匹配的碱基序列reads;统计每个观测区域bin中所述碱基序列reads的数量,其中,所述观测区域bin为所述样本染色体按照预定分窗条件进行分窗后得到的多个区域bin;根据多个观测区域bin中所述碱基序列reads的数量确定隐马尔科夫模型;根据所述隐马尔科夫模型确定基因拷贝数变异CNV,其中,所述拷贝数变异CNV包括:至少一个观测区域bin。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科迅生物技术有限公司,未经北京科迅生物技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711484713.X/2.html,转载请声明来源钻瓜专利网。