[发明专利]二代测序数据的处理方法、装置及电子设备有效
申请号: | 201910444043.1 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110164504B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 卢宇蓝;黎籽秀 | 申请(专利权)人: | 复旦大学附属儿科医院 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B50/00 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 牛晴 |
地址: | 201100 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二代 序数 处理 方法 装置 电子设备 | ||
本申请公开了一种二代测序数据的处理方法、装置及电子设备。其中的方法包括:获取待筛选的二代测序数据;所述待筛选的二代测序数据包括待筛选的变异位点及对应的第一注释;所述第一注释包括测序信息;获取参考数据库;所述参考数据库至少包括:第一类数据库、第二类数据库、第三类数据库、第四类数据库、第五类数据库、第六类数据库;根据所述参考数据库,对所述待筛选的二代测序数据进行注释添加处理,按照预设策略对经过注释添加处理后的所述待筛选的二代测序数据进行变异位点筛选处理,输出筛选的变异位点及经注释添加后的所述第一注释。
技术领域
本申请涉及生物信息技术领域,尤其涉及一种二代测序数据的处理方法、装置及电子设备。
背景技术
脱氧核糖核酸(deoxyribonucleic acid,DNA),是生物染色体的主要组成成分,同时也是生物的主要遗传物质。DNA分子巨大,是由核苷酸组成的序列。DNA测序技术,即测定DNA序列的技术,对生物医疗都具有重大意义。尤其在医疗中,通过分析DNA序列,可以协助临床诊断。Sanger测序技术是第一代DNA测序技术,随着科技的发展,第二代DNA测序技术(简称二代测序技术)也逐渐成熟,相比Sanger测序技术,二代测序技术具有通量高、精度高、成本低的优点。
由于高通量,二代测序技术会产生大量的测序数据,因此,二代测序技术也带来了处理和分析大规模数据的挑战。目前,在消除实验误差、序列片段拼装和定位变异位点等方面对二代测序数据进行处理的方法和流程已经较为完善。经过相关技术处理之后的二代测序数据,可以定位变异位点,但是仍然无法直接应用于临床诊断,主要是因为:
第一,变异位点数据量大。以一份平均测序深度120倍的全外显子检测数据为例,经标准流程处理后,即从二代测序技术得到的二代测序数据的原始文件出发,与参考基因组对比寻找变异位点,一个样本所产生的变异位点数量大约在10万个左右,这些变异位点已经经过实验流程筛选和一定的概率模型筛选,本身作为真实存在的变异位点概率极高(视筛选流程参数而定,可以达到99.99%以上),从测序技术的层面上已经很难进一步筛选。此阶段的数据体现了二代测序技术大通量的特性,试图通过人工来判断每个变异位点的临床意义是不现实的。
第二,变异结果信息不足。二代测序技术本身所产出的变异位点,其结果中仅包含该变异在基因上发生的位置、变异类型和核型,其关注点在于变异位点本身的存在情况,缺少对变异位点的致病性的分析。
发明内容
本申请的目的是提供一种二代测序数据的处理方法、装置及电子设备,以解决相关技术中经过处理之后的二代测序数据无法直接应用于临床诊断的问题。
本申请的目的是通过以下技术方案实现的:
一种二代测序数据的处理方法,包括:
获取待筛选的二代测序数据;所述待筛选的二代测序数据包括待筛选的变异位点及对应的第一注释;所述第一注释包括测序信息;
获取参考数据库;所述参考数据库至少包括:第一类数据库、第二类数据库、第三类数据库、第四类数据库、第五类数据库、第六类数据库;所述第一类数据库包括变异位点及对应的第二注释,所述第二注释包括已报道不致病或者已报道可能致病或者已报道明确致病;所述第二类数据库包括基因位置的注释,所述基因位置的注释包括外显子的捕获区域在基因组上的定位;所述第三类数据库包括已报道与疾病相关的基因;第四类数据库包括基因组上的变异位点以及对应的第三注释,所述第三注释包括基因组上的变异位点在公共人群中出现的频率及核型;所述第五类数据库包括变异位点以及对应的第四注释,所述第四注释包括变异位点在目标地区人群中出现的频率及目标地区的临床报告;所述第六类数据库包括变异位点及对应的第五注释,所述第五注释包括变异位点所属基因已知相关的疾病、疾病的遗传模式、基因功能;
根据所述参考数据库,对所述待筛选的二代测序数据进行注释添加处理,按照预设策略对经过注释添加处理后的所述待筛选的二代测序数据进行变异位点筛选处理,输出筛选的变异位点及经注释添加后的所述第一注释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学附属儿科医院,未经复旦大学附属儿科医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910444043.1/2.html,转载请声明来源钻瓜专利网。