[发明专利]基于三分支CNN的药物靶标结合亲和力预测方法在审
申请号: | 202211552644.2 | 申请日: | 2022-12-06 |
公开(公告)号: | CN116189795A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 陆遥遥;吴宏杰 | 申请(专利权)人: | 苏州科技大学 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16H70/40;G16B30/00;G16B25/00 |
代理公司: | 苏州科仁专利代理事务所(特殊普通合伙) 32301 | 代理人: | 郭杨 |
地址: | 215000*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分支 cnn 药物 靶标 结合 亲和力 预测 方法 | ||
1.一种基于三分支CNN的药物靶标结合亲和力预测方法,其特征在于:包括以下具体步骤:S1、采集DTA数据集,获取药物分子的SMILES序列和蛋白质氨基酸序列;S2、采用RDKIT将所述SMILES序列预处理为具有顶点特征和邻接矩阵的图形;S3、构建结合GAT-GCN和MCNN的DTA预测模型,将所述SMILES序列、所述蛋白质氨基酸序列、所述图形输入所述DTA预测模型内输出预测结果;S4、采用一致性指数和均方误差评估所述DTA预测模型。
2.根据权利要求1所述的基于三分支CNN的药物靶标结合亲和力预测方法,其特征在于:步骤S1中,所述DTA数据集包括Davis数据集和KIBA数据集。
3.根据权利要求1所述的基于三分支CNN的药物靶标结合亲和力预测方法,其特征在于:步骤S1中,选择所述SMILES序列作为药物特征,选择所述蛋白质氨基酸序列作为蛋白质特征。
4.根据权利要求1所述的基于三分支CNN的药物靶标结合亲和力预测方法,其特征在于:所述步骤S2还包括在预处理过程中加入自环,并采用标签方式编码蛋白质氨基酸序列。
5.根据权利要求1所述的基于三分支CNN的药物靶标结合亲和力预测方法,其特征在于:所述步骤S3具体包括:S31、将步骤S2中的具有顶点特征和邻接矩阵的图形输入三个CAT层,输出为特征矩阵;S32、将所述特征矩阵输入GCN层,输出为全局最大池化层和全局平均池化层,计算得出图形表示向量;S33、采用卷积神经网络对蛋白质氨基酸序列的特征进行压缩,从低维空间压缩至高维空间,再采用三分支CNN提取压缩后的蛋白质氨基酸序列的局部特征和全局特征;S34、将蛋白质氨基酸序列的局部特征和全局特征和图形表示向量进行特征融合输入至所述DTA预测模型的预测模块中,得出DTA预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科技大学,未经苏州科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211552644.2/1.html,转载请声明来源钻瓜专利网。