[发明专利]一种模型非依赖的基因组结构变异检测系统及方法有效
申请号: | 202010313833.9 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111583996B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 叶凯;蔺佳栋;杨晓飞;徐暾 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 马贵香 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 依赖 基因组 结构 变异 检测 系统 方法 | ||
1.一种模型非依赖的基因组结构变异检测系统,其特征在于,包括:
比对模块,用于将测序数据与参考基因组进行比对,确定测序数据在参考基因组上的坐标并得到比对结果;
变异信号提取模块,用于从比对结果中提取构建变异信号图所需的节点以及建立节点之间的连接关系,以构建变异信号图;
频繁最大子图挖掘模块,用于采用加入距离约束和超项目数值属性约束的频繁最大子图挖掘算法,在变异信号图中挖掘与频繁变异模式对应的频繁最大子图,并根据频繁最大子图中的节点自带属性的特点判断与该频繁最大子图对应的结构变异在基因组上的具体位置。
2.根据权利要求1所述的模型非依赖的基因组结构变异检测系统,其特征在于,变异信号提取模块包括:
提取过滤模块,用于根据比对结果,通过一遍I/O,过滤掉噪音信号,提取出变异信号;
变异信号图构建模块,用于将潜在变异断点附近的同一种类型的变异信号整合在一起构成变异信号图中的节点,每个节点的信息包括所在参考基因组位置、变异信号强度、等位基因频率和比对方向,按照预先设置的变异信号强度和等位基因频率的阈值过滤噪声节点;过滤后的节点按照其在参考基因组上出现的位置保存在变异特征映射数据库中,同时建立节点的连接关系,得到变异信号图。
3.根据权利要求1所述的模型非依赖的基因组结构变异检测系统,其特征在于,频繁最大子图挖掘模块包括:
挖掘模块,采用加入距离约束和超项目数值属性约束的频繁最大子图挖掘算法,找到变异信号图中包含n个节点的频繁子图及其在参考基因组位点上的变异特征映射数据库,此时n=1;在变异特征映射数据库中当前记录的下游D范围以内或满足读段连接关系的节点中,查找不同于当前记录的节点且节点的数值属性高于预设阈值,使用模式增长法构造包含n+1个节点的子图,将n+1更新为n并相应的更新变异特征映射数据库;重复模式增长法,直到构造的变异特征映射数据库小于预设阈值,得到变异信号图中的所有频繁最大子图;
变异位置确定模块,用于通过频繁最大子图中的不同类型节点的连接关系、裂解读段坐标和部分比对坐标来确定该频繁最大子图对应的结构变异在基因组中的位置。
4.根据权利要求3所述的模型非依赖的基因组结构变异检测系统,其特征在于,D设置为3倍的测序文库片段的标准差加测序文库片段平均值。
5.根据权利要求3所述的模型非依赖的基因组结构变异检测系统,其特征在于,变异位置确定模块使用较差匹配原则辅助判断结构变异在基因组中的位置。
6.一种模型非依赖的基因组结构变异检测方法,其特征在于,包括如下步骤:
步骤1,将测序数据与参考基因组进行比对,确定测序数据在参考基因组上的坐标并得到比对结果;
步骤2,从步骤1的比对结果中提取变异信号并将变异信号聚类合并生成变异信号图的节点,然后根据节点的构成元素建立节点之间的连接关系,构建得到变异信号图;
步骤3,采用加入距离约束和超项目数值属性约束的频繁最大子图挖掘算法,在变异信号图中挖掘与频繁变异模式对应的频繁最大子图,并判断频繁最大子图对应的结构变异在基因组中的位置。
7.根据权利要求6所述的模型非依赖的基因组结构变异检测方法,其特征在于,步骤2具体包括:
1)提取变异信号:根据步骤1的比对结果,通过一遍I/O,过滤掉噪音信号,提取出变异信号;
2)将潜在变异断点附近的同一种类型的变异信号整合在一起,生成信号图中的节点,每个节点的信息包括所在参考基因组位置、变异信号强度、等位基因频率和比对方向,按照预先设置的变异信号强度和等位基因频率的阈值过滤噪声节点;过滤后的节点按照其在参考基因组上出现的位置保存在变异特征映射数据库中,同时建立节点的连接关系,得到变异信号图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010313833.9/1.html,转载请声明来源钻瓜专利网。