[发明专利]一种基于深度学习的药物-药物不良反应预测方法在审

申请号：	202211045611.9	申请日：	2022-08-30
公开（公告）号：	CN115410658A	公开（公告）日：	2022-11-29
发明（设计）人：	苏家明;钱莹	申请（专利权）人：	华东师范大学
主分类号：	G16C20/30	分类号：	G16C20/30;G16C20/50;G16C20/70;G06N3/04;G06N3/08
代理公司：	上海蓝迪专利商标事务所(普通合伙) 31215	代理人：	徐筱梅;张翔
地址：	200241 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习药物不良反应预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的药物-药物不良反应预测方法，其特征在于，该方法包括以下具体步骤：

步骤1：药物分子结构信息编码

1.1)利用RDkit软件将药物的SMILES序列转换成分子图，即将原子作为节点，原子与原子之间的键作为边来构建无向图；对于药物i，构建无向图G_i(V,E)来表示药物i的分子图，其中V是该分子图中所有原子的集合，E是所有键的集合；

1.2)利用带有注意力机制的消息传递网络来对无向图G_i进行编码，包括两个阶段：消息传递阶段及图读出阶段；

1.3)消息传递阶段由消息函数和更新函数组成，在此阶段运行T个时间步长，首先将每个节点的特征初始化为此时的时间步长t＝0，然后利用消息函数对节点v的邻居节点聚合特征向量，其公式为：

其中N(v)是节点v的邻居节点的集合，是可学习的参数矩阵，是节点v的邻居节点w的特征向量；

再利用两个非线性变换函数F和C进行组合作为更新函数，将得到的节点v的邻居聚合特征与节点v的特征进行融合更新得到节点v在(t+1)时间步长上的特征向量其公式为：

其中表示拼接操作，⊙表示内积操作，W_c和W_f是两个可学习的参数；

1.4)在消息传递阶段运行了T个时间步长后，得到药物分子图中每个节点最终特征表示然后在图读出阶段将整个药物分子图计算为一个特征向量E_i^′作为药物分子的结构信息特征；利用带有有效的注意力机制的图读出函数来执行计算，公式为：

其中σ₁和σ₂分别表示sigmoid和tanh激活函数，W_i1和W_i2是两个可学习的权重参数，b_i1和b_i2是两个可学习的偏置向量，会作为注意力机制来表示每个节点重要性分数；

步骤2：药物绑定蛋白信息编码

2.1)药物绑定蛋白是与药物结合并影响其功能来发挥效力的蛋白质,包括：转运蛋白、载体蛋白、酶蛋白和靶标蛋白；绑定蛋白有其各自的特征，首先利用相似性函数来对各个绑定蛋白特征进行计算，公式为：

其中x_i与x_j分别表示药物i和j在某种绑定蛋白上的特征向量；这样能够得到转运蛋白相似性矩阵、载体蛋白相似性矩阵、酶蛋白相似性矩阵和靶标蛋白相似性矩阵；

2.2)然后将四种绑定蛋白特征矩阵拼接送入到带有注意力机制的自动编码器中进行编码，自动编码器是无监督神经网络模型，包含两个部分：编码器和解码器，能够学习到输入数据的特征；最终能够获得每个药物的绑定蛋白特征；

步骤3：自适应学习

3.1)将药物分子结构信息特征和药物绑定蛋白特征拼接送入到自适应学习模块中，在自适应学习模块中首先形成N+2个邻接矩阵，其中N表示不良反应类型对应的邻接矩阵数目，每个邻接矩阵是由一种不良反应事件中具有该不良反应相互作用的药物对节点相连形成的，2个邻接矩阵是药物分子结构信息相似性特征图和药物绑定蛋白相似性特征图进行表示的；相似性特征图是通过度量学习得到的，公式为：

其中S^FS[i,j]代表一个邻接矩阵，i与j分别对应邻接矩阵中药物i和药物j，Φ^FS是K个权重参数的cosine相似性函数，E′_i和E′_j分别对应药物i和药物j的特征，∈为阈值，W_k是可学习的权重参数；这样通过药物分子结构信息特征的相似性和药物绑定蛋白特征的相似性来构造药物分子结构信息相似性特征图和药物绑定蛋白相似性特征图；

3.2)将得到的N+2个邻接矩阵进行自适应变换，自适应变换是通过自适应学习到最有效的药物-药物不良反应之间相关联的元路径：首先利用一个可学习的权重矩阵W_ψ和N+2个邻接矩阵相乘并求和，最终得到一个子图，即在N+2个邻接矩阵中分别学习到权重参数α_t1∈W_ψ，其中α_t1为1x1的权重参数，α_t1越大表示对应的邻接矩阵对预测结果越重要，从而将所有重要的邻接矩阵信息融合到一个子图中去，公式为：

A₁＝∑_t1∈Tα_t1A_t1；

3.3)步骤3.2)是1层自适应变换，即对应1跳距离的邻居节点相连形成的子图，对l层自适应变换并进行矩阵相乘得到长度为l的元路径，也即对于节点l跳距离的邻居节点相连形成的子图，公式为：

A_l＝(∑_t1∈Tα_t1A_t1)(∑_t2∈Tα_t2A_t2)…(∑_tl∈Tα_tlA_tl)，

这样自适应学习到一个具有l跳距离的子图，能够融合有效的药物-药物不良反应类型之间的关联信息，其中l为常量；

3.4)采用多通道进行学习，即设置num-channel个通道进行学习，最终学习到num_channel个具有l跳距离的子图；

3.5)在num_channel个具有l跳距离的子图上运用图卷积神经网络进行训练学习，会把每个通道子图上的节点融合其邻居信息来形成最终的节点特征矩阵，再把多个通道上的节点特征矩阵进行堆叠形成药物最终的特征矩阵；

步骤4：多层感知机预测

4.1)从最终的特征矩阵中提取会发生药物不良反应的药物对的特征，并且将两个药物的特征进行拼接，然后送入到由两层全连接神经网络组成的感知机中进行学习，公式为：

其中W₃和W₄代表可学习的权重参数，b₃和b₄是偏置向量，π是Sigmoid激活函数，是最终的预测值，模型采用交叉熵作为损失函数进行训练学习。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华东师范大学，未经华东师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】