[发明专利]基于单独注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质在审
申请号: | 202011513485.6 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112542211A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 王淑栋;刘嘉丽;宋弢;钟悦 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B40/00;G16C20/30;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 单独 注意力 机制 预测 化合物 蛋白质 亲和力 方法 计算机 设备 存储 介质 | ||
1.一种基于单独注意力机制的预测化合物蛋白质亲和力方法,其特征在于,包括双向门控循环单元(BiGRU)模型和卷积神经网络(CNN)模型,整个网络架构为BiGRU/BiGRU-CNN,其中BiGRU/BiGRU模型中加入了单独注意力机制(Separate_Attention)。包括双向门控循环单元(BiGRU)模型,所述的双向门控循环单元模型包括两个门控循环单元(GRU)组成的序列处理模型,一个输入是向前输入,另一个输入是反向输入,是一个只有输入门和忘记门双向递归神经网络。模型的输入为化合物序列与蛋白质序列,二者输入到BiGRU/BiGRU模型里。其中化合物序列表示为加入化合物分子理化性质的SMILES字符串称为SMILES#,蛋白质序列表示由蛋白质的结构属性编码而成。BiGRU/BiGRU输出为经过单独的注意力模型表示的化合物特征向量和蛋白质特征向量。所述的CNN模型由卷积层、池化层、全连接层组成,该模型的输入为化合物特征向量、蛋白质特征向量;该BiGRU/BiGRU-CNN模型的最终输出为预测化合物蛋白质亲和力值的根均方误差值。
2.如权利要求1所述的模型,其特征在于,所述的双向门控循环单元(BiGRU)模型能够让数据从正反两个方向同时输入,使每一时刻的信息都包含了前后时刻的序列信息,相当于网络在某个特定时刻的序列信息增多,充分利用历史数据的信息,从而使预测更加准确。BiGRU的基本思想是将每个训练序列向前和向后呈现给两个单独的隐藏层,这两个层都连接到相同的输出层。因此输出层就具有了输入序列中每个点的完整过去和未来的信息。其中门控循环单元(GRU)对多元时间序列进行充分的特征提取,不断学习多元时间序列的长期依赖关系,其具体包括:首先通过上一个传输下来的状态和当前节点的输入来获取两个门控状态,分别是控制重置的门控(reset gate)和控制更新的门控(update gate),得到门控信号之后,使用重置门控来得到“重置”之后的数据,将该数据与当前节点的输入进行拼接,再通过双曲正切函数将数据缩放到-1~1的范围内,最后使用上文所述的更新门控进行“遗忘”和“记忆”功能,将状态进行更新到0~1之间,门控信号越接近1,代表“记忆”下来的数据越多。
3.如权利要求2所述的模型,其特征在于,所述的单独注意力机制(Separate_Attention)将注意力分别放在化合物原子和蛋白质二级结构上,可使模型在化合物和蛋白质的字母级别上具有可解释性。
4.如权利要求3所述的模型的注意力权重,其特征在于,所述的卷积神经网络(CNN)模型由卷积(convolution),激活(activation),池化(pooling)三种结构组成。CNN输出的结果是对应化合物蛋白质的特定特征空间,再将CNN输出的特征空间作为全连接层或全连接神经网络(fully connected neural network,FCN)的输入,用全连接层来完成从输入化合物特征向量和蛋白质特征向量的亲和力值得映射。
5.如权利要求4所述的整个模型,其特征在于,所述模型输入为选定的2个变量,输入变量含有来自UniRef数据库的蛋白质结构属性序列、来自STITCH数据库的化合物SMILES#。其中蛋白质结构属性序列由蛋白质的二级结构、蛋白质氨基酸序列的长度、蛋白质的理化性质(极性/非极性、酸性/碱性)和蛋白质的溶剂可及性编码而成。其中化合物SMILES#序列由SMILES字符串、化合物拓扑极性表面积和化合物复杂度编码而成。
6.如权利1所述的模型,其特征在于,对所述的带有单独注意力机制的BiGRU/BiGRU-CNN模型利用已有的大量蛋白质化合物亲和力值进行训练,并获得了完善的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011513485.6/1.html,转载请声明来源钻瓜专利网。