[发明专利]一种利用基因序列信息预测药物最小抑菌浓度的方法有效
申请号: | 202110639770.0 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113257345B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 高军晖;谭润东;江荣峰;余安祺;李小明;潘迎霞;楼敬伟;瞿介明;刘嘉琳;王新军 | 申请(专利权)人: | 上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司;上海张江医学创新研究院;上海交通大学医学院附属瑞金医院 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/00;G06N20/10 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 巩克栋 |
地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 基因 序列 信息 预测 药物 最小 浓度 方法 | ||
1.一种利用基因序列信息预测药物最小抑菌浓度的方法,其特征在于,所述方法包括如下步骤:
(1)获取耐药菌的多个样本的基因组测序数据,并根据所述基因组测序数据生成耐药菌的SNP信息和核苷酸k-mers计数信息;
(2)以至少一种碱基长度的平滑滑动窗口切割所述基因组测序数据,统计切割后所有碱基片段的出现频率;
(3)以至少一种碱基片段进行拼接,合并所得拼接结果与所对应的耐药菌的已知最小抑菌浓度,获得特征数据集;
(4)将所述耐药菌的样本随机分为训练集和测试集,采用所述训练集的特征数据集训练机器学习模型,并使用所述测试集的特征数据集计算所述机器学习模型的预测精度;
步骤(3)中所述碱基片段的长度与步骤(2)中所述的碱基长度对应;
所得特征数据集为以碱基片段的拼接结果为特征、最小抑菌浓度值为标签的表格;
步骤(4)所述机器学习模型包括DNN回归模型和XGBoost分类模型,或DNN回归模型和XGBoost回归模型;
所述方法中DNN回归模型采用所述耐药菌的SNP信息预测最小抑菌浓度,XGBoost分类模型或XGBoost回归模型采用所述耐药菌的核苷酸k-mers信息预测最小抑菌浓度。
2.根据权利要求1所述的方法,其特征在于,步骤(1)所述耐药菌包括肺炎克雷伯氏杆菌、粪肠球菌、金黄色葡萄球菌、鲍曼不动杆菌、铜绿假单胞菌或肠杆菌属菌种中的任意一种。
3.根据权利要求1所述的方法,其特征在于,步骤(1)所述生成耐药菌的SNP信息和核苷酸k-mers计数信息所采用的软件包括Bwa、SamTools或Bcftools。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
使用XGBoost分类模型或XGBoost回归模型对所述耐药菌的核苷酸k-mers计数信息进行排序,使用DNN回归模型对所述耐药菌的SNP信息进行排序,并从原始的基因组测序数据中抽取对应的样本数据、构建新的数据集对机器学习模型进行重新训练的步骤。
5.一种利用基因序列信息预测药物对耐药菌的最小抑菌浓度的装置,其特征在于,所述装置包括:
基因组测序数据获取模块,用于获取耐药菌的多个样本的基因组测序数据,并根据所述基因组测序数据生成耐药菌的SNP信息和核苷酸k-mers计数信息;
特征获取模块,用于切割基因组测序数据、统计切割后所有碱基片段的出现频率和拼接碱基片段,并将拼接结果与最小抑菌浓度对应获取特征数据集;
模型训练模块,用于利用所得特征数据集训练机器学习模型,并测试所得机器学习模型的预测精度;
所述机器学习模型包括DNN回归模型和XGBoost分类模型,或DNN回归模型和XGBoost回归模型;
所述装置中DNN回归模型采用所述耐药菌的SNP信息预测最小抑菌浓度,XGBoost分类模型或XGBoost回归模型采用所述耐药菌的核苷酸k-mers信息预测最小抑菌浓度。
6.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~4中任一项所述的利用基因序列信息预测药物对耐药菌的最小抑菌浓度的方法。
7.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~4中任一项所述的利用基因序列信息预测药物对耐药菌的最小抑菌浓度的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司;上海张江医学创新研究院;上海交通大学医学院附属瑞金医院,未经上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司;上海张江医学创新研究院;上海交通大学医学院附属瑞金医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110639770.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液晶屏金属加固边框制作加工机械
- 下一篇:带可伸缩延伸杆的升降栏杆
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置