[发明专利]结构变异检测模型、其构建方法和装置在审
申请号: | 202110226694.0 | 申请日: | 2021-03-02 |
公开(公告)号: | CN112599193A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 曹善柏;张萌萌;周涛;郭璟;楼峰 | 申请(专利权)人: | 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 路秀丽 |
地址: | 100176 北京市通州区经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结构 变异 检测 模型 构建 方法 装置 | ||
1.一种结构变异检测模型的构建方法,其特征在于,所述方法包括:
对多个阳性样本的测序数据进行基因结构变异检测,得到变异检测结果;
从所述变异检测结果中筛选出基因结构变异的特征;
利用所述基因结构变异的特征进行机器学习模型构建,得到所述结构变异检测模型;
所述基因结构变异的特征包括如下至少之一:
a.结构变异位置;
b.结构变异长度;
c.结构变异序列特征;
d.结构变异周围序列特征;
e.NGS结构变异检测频率;
f.结构变异所在reads 的重复比率;
g.结构变异所在位置测序深度。
2.根据权利要求1所述的方法,其特征在于,对多个阳性样本的测序数据进行基因结构变异检测,得到变异检测结果包括:
将多个所述阳性样本的测序数据与参考基因组序列进行比对,得到比对结果;
从所述比对结果中提取split reads筛选出潜在基因结构变异序列;
对所述潜在基因结构变异序列采用局部组装的方式进行分析,得到局部组装序列;
将所述局部组装序列与所述参考基因组进行二次比对,将完全比对上的碱基占比98%的候选序列作为所述变异检测结果。
3.根据权利要求1或2所述的方法,其特征在于,从所述变异检测结果中筛选出基因结构变异的特征包括;
从所述变异检测结果中去除芯片相关的特征,从而获得所述基因结构变异的特征。
4.根据权利要求3中所述的方法,其特征在于,利用所述基因结构变异的特征进行机器学习模型构建包括:
步骤S1,从多个所述阳性样本中随机选取部分样本,并从所述部分样本对应的所述基因结构变异的特征中随机选取部分所述基因结构变异的特征,进行决策树构建;
步骤S2,重复所述步骤S1多次,建立多棵决策树;
步骤S3,根据多棵所述决策树的集合形成随机森林预测均值,获得定量预测结果,从而形成所述机器学习模型。
5.根据权利要求4所述的方法,其特征在于,所述步骤S1中,
利用选取的部分所述基因结构变异的特征作为多个属性,采用信息增益准则确定多个所述属性中与所述基因结构变异最相关的属性,并利用所述最相关的属性和损失函数择优定量准则构建所述决策树。
6.一种构建结构变异检测模型的装置,其特征在于,所述装置包括:
变异初检模块,用于对多个样本的测序数据进行基因结构变异检测,得到变异检测结果;
特征筛选模块,用于从所述变异检测结果中筛选出基因结构变异的特征;
模型构建模块,用于利用所述基因结构变异的特征进行机器学习模型构建,得到所述结构变异检测模型;
所述基因结构变异的特征包括如下至少之一:
a.结构变异位置;
b.结构变异长度;
c.结构变异序列特征;
d.结构变异周围序列特征;
e.NGS结构变异检测频率;
f.结构变异所在reads 的重复比率;
g.结构变异所在位置测序深度。
7.根据权利要求6所述的装置,其特征在于,所述变异初检模块包括:
一次比对模块,用于将多个所述阳性样本的测序数据与参考基因组序列进行比对,得到比对结果;
变异序列筛选模块,用于从所述比对结果中提取split reads筛选出潜在基因结构变异序列;
组装检测模块,用于对所述潜在基因结构变异序列采用局部组装的方式进行分析,得到局部组装序列;
二次比对模块,用于将所述局部组装序列与所述参考基因组进行二次比对,将完全比对碱基占比98%的候选序列作为所述变异检测结果。
8.根据权利要求6或7所述的装置,其特征在于,所述特征筛选模块包括:芯片特征去除模块,用于从所述变异检测结果中去除芯片相关的特征,从而获得所述基因结构变异的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司,未经北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110226694.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无人机视觉智能检测系统
- 下一篇:基于三维图像的缺陷识别方法、装置及电子设备