[发明专利]二代测序数据的处理方法、装置及电子设备有效
申请号: | 201910444043.1 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110164504B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 卢宇蓝;黎籽秀 | 申请(专利权)人: | 复旦大学附属儿科医院 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B50/00 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 牛晴 |
地址: | 201100 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二代 序数 处理 方法 装置 电子设备 | ||
1.一种二代测序数据的处理方法,其特征在于,包括:
获取待筛选的二代测序数据;所述待筛选的二代测序数据包括待筛选的变异位点及对应的第一注释;所述第一注释包括测序信息;
获取参考数据库;所述参考数据库至少包括:第一类数据库、第二类数据库、第三类数据库、第四类数据库、第五类数据库、第六类数据库;所述第一类数据库包括变异位点及对应的第二注释,所述第二注释包括已报道不致病或者已报道可能致病或者已报道明确致病;所述第二类数据库包括基因位置的注释,所述基因位置的注释包括外显子的捕获区域在基因组上的定位;所述第三类数据库包括已报道与疾病相关的基因;第四类数据库包括基因组上的变异位点以及对应的第三注释,所述第三注释包括基因组上的变异位点在公共人群中出现的频率及核型;所述第五类数据库包括变异位点以及对应的第四注释,所述第四注释包括变异位点在目标地区人群中出现的频率及目标地区的临床报告;所述第六类数据库包括变异位点及对应的第五注释,所述第五注释包括变异位点所属基因已知相关的疾病、疾病的遗传模式、基因功能;
根据所述参考数据库,对所述待筛选的二代测序数据进行注释添加处理,按照预设策略对经过注释添加处理后的所述待筛选的二代测序数据进行变异位点筛选处理,输出筛选的变异位点及经注释添加后的所述第一注释;
所述注释添加处理,至少包括:
对所述待筛选的二代测序数据中存在于所述第一类数据库中的变异位点的所述第一注释添加所述第二注释;
根据所述第二类数据库、所述第三类数据库和所述第四类数据库,对所述待筛选的二代测序数据中、满足第一添加条件的所述待筛选的变异位点的所述第一注释添加注释:若所述待筛选的变异位点位于以所述外显子的捕获区域为基准外扩的区域内,添加第一标记注释,若存在于所述第四类数据库中,添加所述第三注释,若位于已报道与疾病相关的基因,添加变异位点所属已报道与疾病相关的基因;所述第一添加条件包括已报道明确致病的变异位点以外的变异位点;所述第一标记注释包括位于所述外扩的区域内;
对所述待筛选的二代测序数据中满足第二添加条件、且存在于所述第五类数据库中的所述待筛选的变异位点的所述第一注释添加所述第四注释;所述第二添加条件包括:所述待筛选的变异位点位于所述外扩的区域内且不存在于所述第四类数据库中,或者,位于所述外扩的区域内、存在于所述第四类数据库中且核型未见纯合变异,或者,位于所述外扩的区域内、存在于所述第四类数据库中、核型包括纯合变异、位于已报道与疾病相关的基因上且在公共人群中出现的频率小于第一预设频率;
通过预设算法对所述待筛选的二代测序数据中满足所述第二添加条件、且满足第三添加条件的所述待筛选的变异位点进行基因定位和危害等级预测,并添加第二标记注释;所述第二标记注释包括预测的危害等级,所述第三添加条件包括所述待筛选的变异位点不位于所述第五类数据库,或者,位于所述第五类数据库且在目标地区人群中出现的频率小于第二预设频率;
将所述待筛选的二代测序数据中满足所述第二添加条件、所述第三添加条件、且满足第四添加条件的所述待筛选的变异位点添加所述第五注释;所述第四添加条件包括所述待筛选的变异位点位于已报道与疾病相关的基因,或者预测的危害等级为最高等级,或者预测的危害等级低于最高等级且为非同义变异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学附属儿科医院,未经复旦大学附属儿科医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910444043.1/1.html,转载请声明来源钻瓜专利网。