[发明专利]一种基于深度学习的药物互作规则预测方法有效
申请号: | 202010122995.4 | 申请日: | 2020-02-27 |
公开(公告)号: | CN111370073B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 翁祖铨;钟意;罗衡 | 申请(专利权)人: | 福州大学 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G06N3/0464;G06N3/048;G06N3/0475;G06N3/042;G06N3/084;G06N3/09 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 药物 规则 预测 方法 | ||
1.一种基于深度学习的药物互作规则预测方法,该方法基于大数据的智能学习方法,通过学习药物结构的特征来捕获其与相互作用间的关系,其特征在于,包括如下步骤:
步骤S1、获取到已知的药物-药物相互作用对及其相互作用规则的自然语言描述,建立药物互作与互作规则间的药物互作-互作规则类别标签的数据集;
步骤S2、预处理输入药物对的分子结构SMILES,并分别将分子结构处理成矩阵作为共享网络的输入;
步骤S3、利用图卷积层,注意力池化,全连接层,批归一化,激活函数为ReLu,决策函数SoftMax和孪生网络结构构建权重共享的图卷积神经深度网络GCNN;
步骤S4、将步骤S2中处理好的药物对分子分别输入到权重共享的GCNN中,通过若干轮的迭代训练,获得网络模型的权重参数;
步骤S5、使用步骤S4中训练好的GCNN模型,输入需要预测的药物对,待模型提取到药物对的结构特征后,通过决策函数输出药物对所对应的相互作用规则类别;
所述步骤S3的GCNN的建立中,池化方式采用注意力池化的方法,包括三层图卷积层以及三层全连接层,注意力池化定义为:
P=tanh(ATWB)
[aA]i=max1≤j≤LbPi,j及[aB]i=max1≤j≤LaPi,j
rA=P×softmax(aA)及rB=P×softmax(aB)
其中,A和B分别是药物对中两个药物通过权重共享的GCNN所提取的特征矩阵,P是A,B矩阵间的作用的注意力对齐矩阵,aA和aB分别对P做行和列的最大池化,最后通过SoftMax函数得到药物对间的注意力权重rA,rB;
所述步骤S4中GCNN训练过程中,使用预处理好的训练样本作为输入进行有监督的模型训练,通过反向传播更新权重,通过图形处理器GPU进行模型推理,在模型过程中采用五倍交叉验证帮助调整超参数及验证模型稳定性;预处理好的测试样本输入网络对网络性能进行测试;模型优化的目标函数为多分类交叉熵,其定义为:
Li=-∑iti,jlog(pi,j)
其中,p为预测值,t为真实值,i为数据点,j为数据所属的类别,L为损失值。
2.根据权利要求1所述的一种基于深度学习的药物互作规则预测方法,其特征在于,所述步骤S1具体实现过程为:从现有的知识数据中提取药物-药物互作的对应的药物分子名称和结构以及其互作规则,将提取到的药物互作规则分为141类作为药物相互作用的训练及预测标签;同时建立药物对-规则标签的对应关系并构建数据集;数据集分为训练集和测试集两类。
3.根据权利要求1所述的一种基于深度学习的药物互作规则预测方法,其特征在于,所述步骤S2具体实现过程为:共享网络模型有两个输入,即药物对,其中两个输入的形式是两种药物分子的分子线性输入规范,即分子结构SMILES,共享网络模型会自动对输入的分子结构SMILES进行拓扑结构的提取,将其转换成一个65×62的矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010122995.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:接口代码自动同步方法、装置及存储介质
- 下一篇:页面展示方法和设备