[发明专利]一种基于强化学习和分子模拟的靶向多肽设计方法及系统在审
申请号: | 202211692002.2 | 申请日: | 2022-12-28 |
公开(公告)号: | CN115985384A | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 李高登;李津辰;安铎;周晓城 | 申请(专利权)人: | 星希尔生物科技(上海)有限公司 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B15/30;G16B40/00;G06N3/0455;G06N3/0442;G06N3/092 |
代理公司: | 北京中南长风知识产权代理事务所(普通合伙) 11674 | 代理人: | 穆丽红 |
地址: | 200131 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 分子 模拟 靶向 多肽 设计 方法 系统 | ||
1.一种基于强化学习和分子模拟的靶向多肽设计方法,其特征在于,包括:
S1,分别训练多肽分子生成器和多肽-靶点蛋白相互作用预测器,并对所述多肽分子生成器和多肽-靶点蛋白相互作用预测器联用进行强化学习获得多肽氨基酸分布的新潜空间;
S2,从新潜空间采样生成新颖多肽分子集合,并与靶点蛋白进行分子对接获取多肽-靶点蛋白复合物三维结构;
S3,基于所述多肽-靶点蛋白复合物三维结构进行分子动力学模拟,计算结合自由能,按照结合自由能从大大小排序并推荐分子。
2.根据权利要求1所述的一种基于强化学习和分子模拟的靶向多肽设计方法,其特征在于,所述S1包括:
S11,基于人源蛋白质和多肽序列数据训练多肽分子生成器,基于多肽分子生成器获取以高维正态分布表示的潜空间;
S12,基于多肽-靶点蛋白相互作用的数据集训练多肽-靶点蛋白相互作用预测器,并基于所述多肽-靶点蛋白相互作用预测器获取每个多肽-靶点蛋白对的结合强度或概率值;
S13,多肽分子生成器和多肽-靶点蛋白相互作用预测器进行联用和强化学习。
3.根据权利要求2所述的一种基于强化学习和分子模拟的靶向多肽设计方法,其特征在于,所述S11包括:
(1)基于变分自编码器构建多肽分子生成器,包括:构建氨基酸词汇表,使用人源蛋白质数据作为预训练数据集,将所述预训练数据集映射到氨基酸词汇表获取氨基酸序列的嵌入向量x,变分自编码器拟合训练数据得到后验分布q(z|x),所述后验分布q(z|x)将观察作为输入并输出一组参数,一组所述参数用于指定潜变量z的条件分布;将潜变量z和一个服从标准高斯分布的随机噪声ε组合作为解码器的输入,观察p(x|z)的条件分布;
(2)将每个潜变量z作为一个样本z,对于每个样本z,分别确定样本z对应的正态分布的均值和标准差,然后积分域中所有高斯分布的累加形成原始分布P(x)作为VAE的目标函数为:
P(x)=∫P(z)P(χ|z)dz; (1)
(3)对所述变分自编码器的目标函数进行最大似然估计,获得VAE模型的损失函教.其中所述损失函教公式为:
所述损失函数分为两部分,-Dkl(Qφ(z|X)||Pz)这一部分是编码器-解码器的重构误差,该误差描绘了模型还原原始输入的能力;另一部分
是潜空间z的分布与标准分布的KL散度,KL散度用于刻画潜空间分布与标准正态分布的差异;
(4)训练过程中使得损失函数最小化从而获得以高维正态分布表示的潜空间,所述潜空间用于反应原始数据分布;基于迁移学习策略,使用人源多肽数据集对预训练模型进行微调,使得所述潜空间分布在序列长度和氨基酸分布等方面更加符合人源多肽的性质和多肽氨基酸分布的规律,从而得到一个连续可微的潜空间。
4.根据权利要求3所述的一种基于强化学习和分子模拟的靶向多肽设计方法,其特征在于,所述编码器和解码器为变分自编码器架构,采用RNN、GRU、LSTM和Self-attention算法中的一种或多种。
5.根据权利要求3所述的一种基于强化学习和分子模拟的靶向多肽设计方法,其特征在于,所述S12包括:
(1)分别提取多肽和靶点蛋白质的基于序列和结构的特征,包括但不限于基于统计学的特征、生物化学特征、语言模型嵌入特征以及共进化特征;
(2)训练过程中,多肽-靶点蛋白相互作用预测器分别对所述多肽和靶点蛋白质的基于序列和结构的特征进行特征抽取,并进行信息交互,最终使得多肽-靶点蛋白相互作用预测器的损失函数最小化;
(3)基于多肽-靶点蛋白相互作用预测器对给定的多肽和靶点蛋白质的组合给出两者相互作用的强度或概率值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于星希尔生物科技(上海)有限公司,未经星希尔生物科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211692002.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便捷安装的家用电梯轿厢
- 下一篇:安全加密运算装置、安全芯片及电子设备