[发明专利]一种基于深度学习连接片段的化合物优化方法在审
申请号: | 202111408686.4 | 申请日: | 2021-11-24 |
公开(公告)号: | CN114187978A | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 杨跃东;戴凌雪;谭游海;王一 | 申请(专利权)人: | 中山大学 |
主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70;G16C20/90;G06N3/04;G06N3/08;G06N20/20;G06N5/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 连接 片段 化合物 优化 方法 | ||
1.一种基于深度学习连接片段的化合物优化方法,其特征在于:所述的方法包括步骤如下:
S1:基于药物发现数据库对Transformer模型进行预训练,将训练好的Transformer模型初始化Prior先验模型和Agent模型;
S2:随机选择一对片段作为源序列输入;
S3:Agent模型通过采样方式批量生成新分子;
S4:将生成的新分子输入奖励模块得到每个新分子的奖励值,判断新分子的奖励值是否达到预期,若没有达到预期,则执行S5;若达到预期,则执行S6;
S5:将源序列及Agent模型生成的新分子送入Prior先验模型进行监督训练得到新分子的先验似然,将先验似然与S4得到的奖励值组成增强似然;根据新分子的重复性得到一个惩罚矩阵,根据增强似然、惩罚矩阵更新Agent模型的网络参数,并回到步骤S3;
S6:完成对Agent模型的网络参数的调整,实现从已知的活性化合物开始,通过修饰连接子的结构发现结构新颖的理想化合物。
2.根据权利要求1所述的基于深度学习连接片段的化合物优化方法,其特征在于:所述的Transformer模型包括多个编码器-解码器模块;每个编码器包括多头自注意力子层和第一前馈神经网络子层;
所述的多头注意力子层设有若干个并行工作的点积注意力函数,用于聚焦来自不同位置的不同子空间的信息;
所述的第一前馈神经网络子层采用ReLU激活函数;所述的多头注意力子层通过归一化层和一个残差网络与第一前馈神经网络子层连接;
每个解码器包括一个第二前馈神经网络子层和两个注意力子层;所述的第二前馈神经网络子层采用ReLU激活函数;所述的注意力子层利用一个mask模块来屏蔽不应被关注的未来的token;
所述的编码器-解码器模块中的多头注意力子层、注意力子层用于帮助解码器关注源序列中的关键部分,并捕捉编码器和解码器之间的关系。
3.根据权利要求2所述的基于深度学习连接片段的化合物优化方法,其特征在于:所述的多头注意力子层采用所有键计算查询的点积,同时引入比例因子dk以防止点积结果过大,然后采用softmax函数来获得值(v)的权重,其相应的公式如下:
4.根据权利要求3所述的基于深度学习连接片段的化合物优化方法,其特征在于:步骤S3,采样方式批量生成新分子,具体如下:对于给定的源序列通过编码器处理成一个潜向量表示给定利用所述的解码器的输出用一个softmax函数进行归一化,从而产生用于采样token的概率分布,然后每次生成新的分子Y=y1,…,ym的一个token,直到生成带有结束符的token为止;在每次Agent模型训练的第t步,生成yt这一token的可能性取决于和Yt=y1,…,yt-1。
5.根据权利要求4所述的基于深度学习连接片段的化合物优化方法,其特征在于:步骤S5,将源序列及Agent模型生成的新分子输入Prior先验模型进行监督训练得到新分子的先验似然,具体如下:首先,编码器将源序列处理成一个潜向量表示给定和Agent模型生成的新分子Y=(y1,…,ym)的情况下,解码器依次采样生成句子的每个token;在这一过程中动作序列集合代表生成的SMILES,动作概率的乘积则代表Prior先验模型生成新分子的先验似然,形式上为:
式中,t=1,…,n;π表示更新Agent策略。
6.根据权利要求5所述的基于深度学习连接片段的化合物优化方法,其特征在于:所述的Agent模型是Prior先验模型的一个实例化副本;因此,初始化的Prior先验模型和Agent模型是相同的;所述的Agent模型用于产生对某种生物靶标有活性的分子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111408686.4/1.html,转载请声明来源钻瓜专利网。