[发明专利]一种基于自注意力机制与多药物特征组合的预测方法有效
申请号: | 202011403977.X | 申请日: | 2020-12-04 |
公开(公告)号: | CN112435720B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 宋晓宁;华阳;於东军;冯振华 | 申请(专利权)人: | 上海蠡图信息科技有限公司 |
主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70;G16B15/30;G16B40/00 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 朱宝庆 |
地址: | 200000 上海市宝山*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 药物 特征 组合 预测 方法 | ||
本发明公开了一种基于自注意力机制与多药物特征组合的预测方法,包括药物分子经过扩展连通性指纹和Mol2Vec向量编译两种嵌入特征,由双向门控循环单元和邻域卷积抽取药物特征;所述药物中的蛋白质序列在经过特征嵌入后,利用一维卷积提取蛋白特征并与所述药物特征做相关注意力增强;拼接所述药物特征和所述蛋白特征,利用自注意力机制增强对蛋白质药物相互作用信息的提取;将所述拼接后的特征放入双向门控循环单元并预测蛋白质和药物的相互作用。将Morgan指纹编译和Mol2vec向量嵌入结合,使所提取的药物特征信息更为丰富;发现卷积网络结合门控循环单元提取蛋白质和药物特征,配合注意力机制强化提取蛋白质和药物之间的关系特征,可有效提升模型的性能。
技术领域
本发明涉及蛋白质-药物相互作用预测的技术领域,尤其涉及一种基于自注意力机制与多药物特征组合的预测方法。
背景技术
蛋白质-药物相互作用的预测工作在早期药物筛选中至关重要,根据美国药物研究与制造商协会统计,整个制药业75%的收益都用于新药研究。此外,经初筛命中的化合物仅有不到5%能用于临床实验,传统大规模实验筛选往往需要花费2-3年的时间,耗费研究人员大量的时间和精力,而使用计算机对药物进行虚拟筛选用时短、准确率高,可以有效降低药物筛选的成本。不过实现药物虚拟筛选的前提是先预测出不同蛋白质和药物之间的相互作用(Protein-Drug Interaction,PDI)。
方法大都使用MLP模型预测蛋白质-药物的相互作用,但这种方法不能凸显出药物特征的局部重要信息,也致使整个模型的预测性能不能达到最佳,因此提出了一种使用深度长短期记忆网络(Deep Long Short-Term Memory,DeepLSTM)的方法预测蛋白质-药物相互作用,其结果分别在酶和G蛋白耦联受体的作用预测中达到了最佳。虽然该方法仍然无法做到大规模的蛋白质-药物的相互作用预测,但表明时序信息的介入可以捕捉更多有效的蛋白质和药物之间相互作用的鉴别特征;因此需要进行研究以进一步提升模型在大规模蛋白质-药物相互作用预测中的效果。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有蛋白质-药物相互作用预测存在的问题,提出了本发明。
因此,本发明解决的技术问题是:传统方法虽有效给出分子的细节特征,但缺乏药物分子的结构信息往往直接影响蛋白质-药物相互作用预测的性能;可随着药物种类的增多,现有图卷积模型对分子结构的辨识度会逐渐下降,从而导致模型的整体性能下降并且现有方法大都使用MLP模型预测蛋白质-药物的相互作用。但这种方法不能凸显出药物特征的局部重要信息,也致使整个模型的预测性能不能达到最佳。
为解决上述技术问题,本发明提供如下技术方案:药物分子经过扩展连通性指纹和Mol2Vec向量编译两种嵌入特征,由双向门控循环单元和邻域卷积抽取药物特征;所述药物中的蛋白质序列在经过特征嵌入后,利用一维卷积提取蛋白特征并与所述药物特征做相关注意力增强;拼接所述药物特征和所述蛋白特征,利用自注意力机制增强对蛋白质药物相互作用信息的提取;将所述拼接后的特征放入双向门控循环单元并预测蛋白质和药物的相互作用。
作为本发明所述的基于自注意力机制与多药物特征组合的预测方法的一种优选方案,其中:所述提取药物特征包括,结合扩展连通性指纹和Mol2Vec向量编译两种方式对药物进行特征嵌入,首先将嵌入特征通过双向门控循环单元进行特征抽取,并将两种方式所得药物特征进行拼接,然后利用一维卷积神经网络对药物特征进行进一步特征提取;最后将得到的结果与蛋白特征一同送入分类器,从而获取药物特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蠡图信息科技有限公司,未经上海蠡图信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011403977.X/2.html,转载请声明来源钻瓜专利网。