[发明专利]待变异检测文件的处理方法及装置有效
申请号: | 201310629728.6 | 申请日: | 2013-11-29 |
公开(公告)号: | CN103617256B | 公开(公告)日: | 2018-01-02 |
发明(设计)人: | 闫军;吴俊;张钰 | 申请(专利权)人: | 北京诺禾致源科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F19/18 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 吴贵明,张永明 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 变异 检测 文件 处理 方法 装置 | ||
1.一种待变异检测文件的处理方法,其特征在于,包括:
根据待变异检测文件来获取比对数据;
对所述比对数据进行预处理和/或校正处理,获取用于变异检测的比对数据;
对所述用于变异检测的比对数据进行变异检测,获取变异检测结果;
获取所述变异检测结果进行深度处理后的输出结果;
对所述用于变异检测的比对数据进行变异检测,获取变异检测结果的步骤包括:
判断所述用于变异检测的比对数据是否是二倍体基因组;
在所述用于变异检测的比对数据是二倍体基因组的情况下,在对所述二倍体基因组进行去冗余和/或压缩操作之后,执行变异检测,获取变异检测结果;
在所述用于变异检测的比对数据为非二倍体基因组的情况下,对所述非二倍体基因组进行变异检测,获取变异检测结果;
所述待变异检测文件还包括:CDS注释信息,其中,获取所述变异检测结果进行深度处理后的输出结果的步骤包括:
对所述变异检测结果进行分类,并将分类后的所述变异检测结果中质量低的变异位点数据进行删除,生成SNP数据集合以及InDel数据集合;
将所述SNP数据集合以及InDel数据集合中间距小于预定值的变异位点进行删除,获取变异位点集合;
判断是否获取到所述CDS注释信息,其中,在获取到所述CDS注释的情况下,对所述SNP数据集合中的位点进行同义非同义注释和转换颠换统计,生成注释和统计信息。
2.根据权利要求1所述的方法,其特征在于,根据待变异检测文件来获取比对数据的步骤包括:
获取输入文件,所述输入文件包括:参考基因组序列和变异检测序列;
判断所述变异检测序列的类型,其中,如果所述变异检测序列的类型是原始测序序列,则将所述原始测序序列往所述参考基因组序列上进行比对,生成所述比对数据,否则所述变异检测序列为所述比对数据。
3.根据权利要求2所述的方法,其特征在于,将所述原始测序序列往所述参考基因组序列上进行比对,生成所述比对数据的步骤包括:
获取所述参考基因组序列,所述参考基因组序列包括:参考基因组索引和所述参考基因组索引对应的参考基因组;
将所述原始测序序列与所述参考基因组索引对应的参考基因组进行比对,生成所述比对数据,其中,所述原始测序序列的类型包括单端测序序列和双端测序序列,采用所述单端测序序列对应的对比策略或所述双端测序序列对应的对比策略来将所述原始测序序列进行比对处理。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,对所述比对数据进行预处理包括如下任意一个或多个处理方式:对所述比对数据进行排序处理、对所述比对数据进行筛选处理、对所述比对数据进行去重处理、对所述比对数据进行重新排序处理、对所述比对数据预定片断区域内的序列进行重新比对处理。
5.根据权利要求4所述的方法,其特征在于,对所述比对数据进行预处理的步骤包括:
对所述比对数据进行排序处理,该步骤包括:按照所述比对数据中的序列比对到染色体上的坐标位置将所述比对数据中的序列进行排序,生成排序后的比对数据;
在所述排序后的比对数据中添加样本分类信息,得到分类后的比对数据;
对所述比对数据进行筛选处理,该步骤包括:去除所述分类后的比对数据中的次要比对数据,生成筛选后的比对数据;
对所述比对数据进行去重处理,该步骤包括:删除所述筛选后的比对数据中重复的比对数据,生成去重后的比对数据;
对所述比对数据进行重新排序处理,该步骤包括:根据参考基因组序列的染色体序列对所述去重后的比对数据进行重新排序,生成重新排序后的比对数据;
对所述比对数据预定片断区域内的序列进行重新比对处理,该步骤包括:提取所述重新排序后的比对数据中的所述预定片断,将靠近所述预定片断的预定区域内的比对数据进行重新比对,生成预选比对数据。
6.根据权利要求5所述的方法,其特征在于,对所述比对数据进行校正处理的步骤包括:
根据所述预选比对数据获取训练数据集合;
根据所述训练数据集合对所述预选比对数据进行碱基质量值的重新校正,生成所述用于变异检测的比对数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京诺禾致源科技股份有限公司,未经北京诺禾致源科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310629728.6/1.html,转载请声明来源钻瓜专利网。