[发明专利]一种基于模式增长算法的基因变异检测方法有效
申请号: | 202010121579.2 | 申请日: | 2020-02-26 |
公开(公告)号: | CN111243663B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 叶凯;杨帆;杨晓飞;蔺佳栋;梁皓;郭立 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/30;G16B30/10;G16B40/10 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 马贵香 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模式 增长 算法 基因 变异 检测 方法 | ||
1.一种基于模式增长算法的基因变异检测方法,其特征在于,包括如下步骤:
第一步:预处理测序比对数据;
第二步:在预处理后的测序比对数据中提取有变异特征信号的数据并进行聚类,将聚类后的每一类数据中所有的短读段序列依据比对状态拆分成状态分别为S和M的两段,将所有的S段的序列压缩建立一致性序列,将所有的M段的序列压缩建立一致性序列;并对同一类中的数据信息进行计算,则每一类数据均形成一个超项目,即每个超项目代表的是不同比对状态的各个断点,然后根据每个超项目在基因组上的位置将每个超项目按顺序存入变异信号数据库中;有变异特征信号的数据通过以下过程得到:在预处理后的测序比对数据中,提取比对状态显示为SM和MS的比对数据,对每一条提取的数据,依据比对状态及比对到的起始坐标位置,计算对应的断点位置;得到相同断点位置且比对状态为SM的比对数据以及相同断点位置且比对状态为MS的比对数据;
第三步,将变异信号数据库中的各个超项目的一致性序列,使用模式增长算法,建立断点间的比对关系;
第四步:建立变异模型,将有相互比对关系的断点带入变异模型,确定变异的类型。
2.根据权利要求1所述的一种基于模式增长算法的基因变异检测方法,其特征在于,第一步中,对二代测序比对数据进行过滤,得到预处理后的测序比对数据。
3.根据权利要求1所述的一种基于模式增长算法的基因变异检测方法,其特征在于,第一步中,预处理后的测序比对数据包括短读段比对到参考基因上的信息,包括比对到参考基因组后的染色体名称,比对到的起始坐标位置,短读段的序列数据以及该短读段的比对状态。
4.根据权利要求1所述的一种基于模式增长算法的基因变异检测方法,其特征在于,第三步的具体过程为:将变异信号数据库中的各个超项目的一致性序列,利用模式增长算法进行序列间比对,则得到序列间的比对信息;对序列间的比对信息进行整理,若有两断点的S与M状态序列能实现交叉比对,则得到这两个断点间的相互比对关系。
5.根据权利要求1所述的一种基于模式增长算法的基因变异检测方法,其特征在于,第四步中,对缺失、重复和反转变异依据变异特征分别建立相应的变异模型:将有相互比对关系的断点带入变异模型,若符合某种变异模型的断点状态特征,则确定变异的类型,最终完成了对变异位置和类型的判断,完成变异检测。
6.根据权利要求5所述的一种基于模式增长算法的基因变异检测方法,其特征在于,对于缺失类型变异,左断点处序列比对状态为MS,右断点为SM;对于重复类型变异,左断点处序列比对状态为SM,右断点为MS;对于反转类型变异,左右断点的比对状态相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010121579.2/1.html,转载请声明来源钻瓜专利网。