[发明专利]一种基于迁移学习和图神经网络的离子液体型抗生素的药性预测方法及高通量筛选平台在审
申请号: | 202111531094.1 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114220497A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 董坤;陈俊武;李垚;张锁江 | 申请(专利权)人: | 中国科学院过程工程研究所 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/70;G06N3/04;G06N3/08 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 王艳斋 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 神经网络 离子 液体 抗生素 药性 预测 方法 通量 筛选 平台 | ||
1.一种基于迁移学习和图神经网络的离子液体型抗生素的药性预测方法及高通量筛选平台,其特征在于,包括如下步骤:
(1)从公开数据库和文献中搜集有机分子和离子液体对病菌的最低抑菌浓度,经数据清洗后分别作为预训练和最终训练的数据集,每个数据集又分为训练集、验证集和测试集;
(2)分别构建单个图输入和多个图输入的图神经网络;
(3)采用预训练数据集对单图输入模型进行预训练;
(4)通过迁移学习的方法将预训练模型参数移植到多图输入模型中;
(5)采用离子液体的数据对多图输入模型进行训练,进行模型性能的验证,得到离子液体抗菌性能预测模块;
(6)构建离子液体的理论结构库;
(7)通过预测模块对理论结构库中的离子液体进行抗菌性预测,并最终筛选出具有优异抗菌性能的离子液体结构。
2.根据权利要求1所述的方法,其特征在于,步骤(1)包括:
(1.1)对应的有机分子和离子液体数据集是针对同一病菌的最低抑菌浓度数据;
(1.2)设置区分活性的阈值为16μg/mL,最低抑菌浓度大于阈值定义为非活性,最低抑菌浓度小于阈值定义为活性,模型预测任务为二分类问题;
(1.3)建立的数据集中化合物用化学分子规范表达式SMILES描述,由SMILES生成化合物的原子特征(节点属性)和化学键特征(边属性),从而形成模型输入所需的图数据;其中,原子特征包括元素类型、形式电荷、自由度、手性、键连氢原子数、杂化方式、芳香性、是否环内原子和原子质量,化学键特征包括键级、是否共轭、是否环内和立体异构性;
(1.4)基于化合物的亚结构(scaffold)将数据集切分为训练集、验证集和测试集。
3.根据权利要求1所述的方法,其特征在于,步骤(2)包括:
(2.1)单个图或多个图输入的图神经网络都采用消息传递机制,包括传递模块和读出模块,其中传递模块对每个节点或者有向边的特征进行多次邻域聚合和更新迭代,该模块由卷积层、门控循环单元和非线性变换构成;其中读出模块由Set2Set池化层、多层神经网络和Sigmoid激活函数构成;
(2.2)单图输入网络以每个有机分子SMILES生成的图数据为输入,多图输入网络以离子液体、离子液体的阳离子和阴离子的SMILES生成的3个图数据为输入。
4.根据权利要求1所述的方法,其特征在于步骤(3)和(5)中,模型训练采用ADAM优化器,二元交叉熵损失函数和线性学习率衰减方案。
5.根据权利要求1所述的方法,其特征在于步骤(6)中,所述的离子液体理论结构库的构建步骤为:
(6.1)随机组合搜集的离子液体阳离子和阴离子的SMILES,由SMILES生成理论离子液体的原子坐标文件;
(6.2)采用PM7半经验分子轨道法优化(6.1)中生成的离子液体结构,并剔除不稳定或不符合化学概念的结构;
(6.3)将合理的离子液体及其阴阳离子的SMILES、优化后的原子坐标和PM7计算生成的量化性质汇集并构建数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院过程工程研究所,未经中国科学院过程工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111531094.1/1.html,转载请声明来源钻瓜专利网。