[发明专利]基于单独注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质在审
申请号: | 202011513485.6 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112542211A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 王淑栋;刘嘉丽;宋弢;钟悦 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B40/00;G16C20/30;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 单独 注意力 机制 预测 化合物 蛋白质 亲和力 方法 计算机 设备 存储 介质 | ||
本发明公开了一种基于单独注意力机制的预测化合物蛋白质亲和力方法。所述方法包括双向门控循环单元(BiGRU)模型和卷积神经网络(CNN)模型,整个网络架构为BiGRU/BiGRU‑CNN,其中BiGRU/BiGRU模型中加入了单独注意力机制(Separate_Attention)。所述的双向门控循环单元模型包括两个门控循环单元(GRU)组成的序列处理模型,一个输入是向前输入,另一个输入是反向输入,是一个只有输入门和忘记门双向递归神经网络。模型的输入为化合物序列与蛋白质序列,二者输入到BiGRU/BiGRU模型里。其中化合物序列表示为加入化合物分子理化性质的SMILES字符串称为SMILES#,蛋白质序列表示由蛋白质的结构属性编码而成。BiGRU/BiGRU输出为经过单独的注意力模型表示的化合物特征向量和蛋白质特征向量。所述的CNN模型由卷积层、池化层、全连接层组成,该模型的输入为化合物特征向量、蛋白质特征向量;该BiGRU/BiGRU‑CNN模型的最终输出为预测化合物蛋白质亲和力值的根均方误差值。
技术领域
本发明涉及化合物蛋白质分子结构与性质领域,具体涉及一种基于单独注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质。
背景技术
识别化合物和蛋白质之间的相互作用对发现和开发安全有效的药物具有重要意义。揭示未知的化合物蛋白质相互作用(CPI)有助于预测潜在的副作用,并发现现有药物的新用途,如药物重定位。单纯依靠传统实验识别CPI既费时又昂贵,因此基于临床试验已经测量到的相互作用,使用统计和机器学习的模型来预测化合物蛋白质相互作用强度是一个重要的替代方法。如从化学基因组学角度开发出的机器学习预测方法,该方法将化学空间、基因组空间及其相互作用考虑到统一的框架内。
深度学习的引入被证明是预测药物靶点结合亲和力的最佳模型之一。深度学习的主要优点是通过在每一层中进行非线性转换,它们能够更好的表示原始数据进而便于学习数据中隐藏的模式。然而很多模型的化合物表示仅仅是分子指纹、单一的SMILES字符串。这样会使编码的化合物特征表示丢失许多化合物原有的重要信息,造成最终预测化合物蛋白质亲和力值的不准确性。
发明内容
本发明的目的是为了解决上述化合物分子重要信息丢失并提高预测准确率等问题,本发明实施例提供了一种基于单独注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质,能够将化合物分子的结构性质编码到SMILES字符串中,从而可以提取到更多关于化合物分子的信息,并且在化合物蛋白质特征表示过程中分别加入注意力模型即单独注意力机制使得获取更精确的特征表示向量,并且使用深度学习方法提高预测化合物蛋白质亲和力值的准确率。
根据本发明实施例的第一方面,提供了基于单独注意力机制的预测化合物蛋白质亲和力方法。
在一些可选实施例中,所述方法包括双向门控循环单元(BiGRU)模型和卷积神经网络(CNN)模型,整个网络架构为BiGRU/BiGRU-CNN,其中BiGRU/BiGRU模型中加入了单独注意力机制(Separate_Attention)。所述的双向门控循环单元模型包括两个门控循环单元(GRU)组成的序列处理模型,一个输入是向前输入,另一个输入是反向输入,是一个只有输入门和忘记门双向递归神经网络。模型的输入为化合物序列与蛋白质序列,二者输入到BiGRU/BiGRU模型里。其中化合物序列表示为加入化合物分子理化性质的SMILES字符串称为SMILES#,蛋白质序列表示由蛋白质的结构属性编码而成。BiGRU/BiGRU输出为经过单独的注意力模型表示的化合物特征向量和蛋白质特征向量。所述的CNN模型由卷积层、池化层、全连接层组成,该模型的输入为化合物特征向量、蛋白质特征向量;该BiGRU/BiGRU-CNN模型的最终输出为预测化合物蛋白质亲和力值的根均方误差值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011513485.6/2.html,转载请声明来源钻瓜专利网。