[发明专利]基于三分支CNN的药物靶标结合亲和力预测方法在审
申请号: | 202211552644.2 | 申请日: | 2022-12-06 |
公开(公告)号: | CN116189795A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 陆遥遥;吴宏杰 | 申请(专利权)人: | 苏州科技大学 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16H70/40;G16B30/00;G16B25/00 |
代理公司: | 苏州科仁专利代理事务所(特殊普通合伙) 32301 | 代理人: | 郭杨 |
地址: | 215000*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分支 cnn 药物 靶标 结合 亲和力 预测 方法 | ||
一种基于三分支CNN的药物靶标结合亲和力预测方法,包括采集DTA数据集,获取药物分子的SMILES序列和蛋白质氨基酸序列;采用RDKIT将所述SMILES序列预处理为具有顶点特征和邻接矩阵的图形;构建结合GAT‑GCN和MCNN的DTA预测模型,将所述SMILES序列、所述蛋白质氨基酸序列、所述图形输入所述DTA预测模型内输出预测结果;采用一致性指数和均方误差评估所述DTA预测模型。采用三分支CNN,分子的结构信息不会丢失,使用三个不同数量的卷积层和不同大小的卷积核,不仅能够获得较多的全局特征,局部特征也不会丢失,预测精确有效。
技术领域
本发明涉及生物和药物信息学以及人工智能领域,尤其涉及一种基于三分支CNN的药物靶标结合亲和力预测方法。
背景技术
蛋白质涉及细胞生命活动的方方面面,在人体免疫中起着至关重要的作用。许多疾病是由蛋白质的功能障碍引起的。特定的药物可以改变体内原生蛋白质的工作方式,从而达到预期的治疗效果。在新药的发现和重新定位中,能否准确预测药物靶点结合亲和力成为研究的重点。
虽然实验室中的实验方法已经发展到筛选和表征化学分子,但是从潜在化合物库中大规模完成鉴定是十分耗时耗力的。为了节省时间成本和人工成本,并有效利用资源,已经开发了许多计算机辅助药物设计方法。虚拟筛选是主要方法之一。它通过许多计算模型预测可能的潜在药物,并从大规模化合物配体库中筛选出感兴趣的受体蛋白的候选配体。虚拟筛选可以大大减少候选配体的数量,显著缩短实验周期,从而加速药物发现。
虚拟筛选方法通常基于预测药物靶标相互作用或药物靶标亲和力(DTA),主要表现为输入是药物和蛋白质进行编码后的矢量或图形,任务是分类问题或回归问题。然而,相互作用可以理解为一系列连续的值,用于表示不同药物靶点相互作用的强度。
现在有各种基于深度学习的技术方案来研究药物靶向结合,然而,在深度学习模型中,大多数实验都是以字符串的形式表达药物,一维序列的形式并不是分子的自然表达方式,当我们使用字符串时,分子的结构信息就丢失了。另外,大多方法只有单分支CNN,经过卷积层叠加后,整个特征信息被捕获成一小部分,此时原始数据的一些局部特征会丢失。
发明内容
本发明要解决的技术问题是提供一种基于三分支CNN的药物靶标结合亲和力预测方法。
为了解决上述技术问题,本发明采用的技术方案是:一种基于三分支CNN的药物靶标结合亲和力预测方法,包括以下具体步骤:S1、采集DTA数据集,获取药物分子的SMILES序列和蛋白质氨基酸序列;S2、采用RDKIT将所述SMILES序列预处理为具有顶点特征和邻接矩阵的图形;S3、构建结合GAT-GCN和MCNN的DTA预测模型,将所述SMILES序列、所述蛋白质氨基酸序列、所述图形输入所述DTA预测模型内输出预测结果;S4、采用一致性指数和均方误差评估所述DTA预测模型。
优选的,步骤S1中,所述DTA数据集包括Davis数据集和KIBA数据集。
优选的,步骤S1中,选择所述SMILES序列作为药物特征,选择所述蛋白质氨基酸序列作为蛋白质特征。
优选的,所述步骤S2还包括在预处理过程中加入自环,并采用标签方式编码蛋白质氨基酸序列。
优选的,所述步骤S3具体包括:S31、将步骤S2中的具有顶点特征和邻接矩阵的图形输入三个CAT层,输出为特征矩阵;S32、将所述特征矩阵输入GCN层,输出为全局最大池化层和全局平均池化层,计算得出图形表示向量;S33、采用卷积神经网络对蛋白质氨基酸序列的特征进行压缩,从低维空间压缩至高维空间,再采用三分支CNN提取压缩后的蛋白质氨基酸序列的局部特征和全局特征;S34、将蛋白质氨基酸序列的局部特征和全局特征和图形表示向量进行特征融合输入至所述DTA预测模型的预测模块中,得出DTA预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科技大学,未经苏州科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211552644.2/2.html,转载请声明来源钻瓜专利网。