[发明专利]一种无对照体细胞突变检测方法及装置有效
申请号: | 201910395409.0 | 申请日: | 2019-05-14 |
公开(公告)号: | CN109903811B | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 李超;王威;张兵 | 申请(专利权)人: | 慧算医疗科技(上海)有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/00 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 朱凌娇;许亦琳 |
地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 亚克隆 突变基因位点 克隆 驱动 突变 突变检测 预测模型 体细胞 筛选 靶向治疗 待测样本 检测数据 聚类算法 正常组织 治疗效果 治疗药物 肿瘤治疗 注释信息 聚类 治疗 肿瘤 预测 | ||
1.一种用于临床研究和基础研究的无对照体细胞突变检测方法,所述方法无需源自自体的正常组织对照,所述方法至少包括以下步骤:
S1:获取待测样本的突变基因位点的检测数据,所述突变基因位点的检测数据包括碱基置换突变信息和拷贝数变异信息;
S2:根据所述突变基因位点的检测数据信息,基于聚类算法对突变基因位点进行相似聚类,即形成亚克隆分层;
S3:注释各亚克隆内各突变基因位点;
S4:建立亚克隆预测模型;
S5:将步骤S3得到的各亚克隆内各突变基因位点注释信息输入到所述亚克隆预测模型中,预测各亚克隆属于第一克隆,第二克隆和第三克隆中的哪一类;所述第一克隆是指肿瘤的驱动克隆,所述第二克隆是指过客克隆,所述第三克隆为不携带体细胞突变的集合;
步骤S4中,基于增强学习算法建立所述亚克隆预测模型;所述增强学习算法选自AdaBoost算法;用AdaBoost算法,将已知体细胞突变信息的各个样本的突变的基因位点的注释信息转化合并成一个文件,每行一个样本,形成一个输入的特征集文件;将所述输入的特征集文件读入,以所述突变的基因位点属于第一克隆,第二克隆和第三克隆的哪一类作为目标值,以所述特征集文件中的注释信息作为特征进行增强学习模型的拟合,利用cross-validation得到最优的参数,得到亚克隆预测模型。
2.如权利要求1所述的无对照体细胞突变检测方法,其特征在于,还包括以下特征中的一项或多项:
a.步骤S2中,所述聚类算法选自K-Means聚类算法;
b.步骤S3中,注释信息选自突变的人群分布信息,癌种特异的突变分布信息和突变功能信息中的一种或多种。
3.如权利要求2所述的无对照体细胞突变检测方法,其特征在于:
步骤S1中,获取待测样本的突变基因位点的检测数据的方法包括如下步骤:
1)测序下机数据通过BCL2fastq软件,利用样本的标签序列信息从测序BCL数据中分离样本数据并转换成fastq文件;
2)fastq文件通过BWA算法比对到人类参考基因组得到记录比对信息的SAM文件,并利用samtools软件转换为BAM 文件;
3)使用varscan2算法鉴别出样本的突变和拷贝数变异,得到样本的突变信息和拷贝数变异信息,即突变基因位点的检测数据。
4.一种无对照体细胞突变检测装置,其特征在于,所述装置无需正常组织对照,所述装置至少包括:
获取模块,用于获取待测样本的突变基因位点的检测数据,所述突变基因位点的检测数据包括碱基置换突变信息和拷贝数变异信息;
分层模块,用于根据所述突变基因位点的检测数据信息,基于聚类算法对突变基因位点进行相似聚类,即形成亚克隆分层;
注释模块,用于注释各亚克隆内各突变基因位点;
建模模块,用于建立亚克隆预测模型;
预测模块,用于将注释模块得到的各亚克隆内各突变基因位点注释信息输入到所述亚克隆预测模型中,预测各亚克隆属于第一克隆,第二克隆和第三克隆中的哪一类;所述第一克隆是指肿瘤的驱动克隆,所述第二克隆是指过客克隆,所述第三克隆为不携带体细胞突变的集合;
建模模块中,基于增强学习算法建立所述亚克隆预测模型;所述增强学习算法选自AdaBoost算法;用AdaBoost算法,将已知体细胞突变信息的各个样本的突变的基因位点的注释信息转化合并成一个文件,每行一个样本,形成一个输入的特征集文件;将所述输入的特征集文件读入,以所述突变的基因位点属于第一克隆,第二克隆和第三克隆的哪一类作为目标值,以所述特征集文件中的注释信息作为特征进行增强学习模型进行增强学习模型的拟合,利用cross-validation得到最优的参数,得到亚克隆预测模型。
5.如权利要求4所述的无对照体细胞突变检测装置,其特征在于,还包括以下特征中的一项或多项:
a.分层模块中,所述聚类算法选自K-Means聚类算法;
b.注释模块中,注释信息选自突变的人群分布信息,癌种特异的突变分布信息和突变功能信息中的一种或多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧算医疗科技(上海)有限公司,未经慧算医疗科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910395409.0/1.html,转载请声明来源钻瓜专利网。