[发明专利]药物-靶蛋白亲和力预测方法及系统有效
申请号: | 202111130899.5 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113823352B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 汲化;李梅;徐思涵;蔡祥睿 | 申请(专利权)人: | 南开大学 |
主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B20/00;G16B40/00 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 朱忠范 |
地址: | 300071 天津*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 药物 蛋白 亲和力 预测 方法 系统 | ||
1.一种药物-靶蛋白亲和力预测方法,其特征在于,包括:
对待检测的药物-靶蛋白对中的药物化学分子和靶蛋白分子分别进行编码,得到药物输入表示和靶蛋白输入表示;
利用药物-靶蛋白亲和力预测模型对所述药物输入表示和靶蛋白输入表示进行处理,得到药物-靶蛋白亲和力预测值;其中,所述药物-靶蛋白亲和力预测模型利用训练集训练得到,所述训练集包括多个药物-靶蛋白对以及标注每个药物-靶蛋白对中的药物和靶蛋白亲和力的真实值的标签,利用训练集训练得到所述药物-靶蛋白亲和力预测模型包括:
定义预测子任务;其中,预测子任务为预测以一个药物为核心结合不同的靶蛋白的药物-靶蛋白亲和力或预测以一个靶蛋白为核心结合不同药物的药物-靶蛋白亲和力;
获得对应的定义的子任务的药物-靶蛋白对中药物输入表示和靶蛋白输入表示,输入至任务自适应元学习神经网络进行训练,得到任务自适应元学习神经网络预训练模型;优化任务自适应元学习神经网络预训练模型,得到药物-靶蛋白亲和力预测模型;所述任务自适应元学习神经网络包括药物嵌入层、靶蛋白嵌入层、药物编码模块、靶蛋白编码模块、特征融合层和预测模块;其中,所述药物编码网络和靶蛋白编码网络均包括三个一维卷积层,第三个一维卷积层后均连接一个最大池化层;所述预测模块包括四个全连接层;药物编码模块和靶蛋白编码模块中每一个一维卷积层的输出经过泄露修正线性单元激活;预测模块中前三个全连接层的输出经过泄露修正线性单元激活;
对于每个预测子任务,利用药物输入表示,得到药物特征表示,利用靶蛋白输入表示,得到靶蛋白特征表示;将所述药物特征表示和与之对应的靶蛋白特征表示进行特征融合,得到药物-靶蛋白融合特征表示;根据所述药物-靶蛋白融合特征表示,得到该预测子任务中的药物-靶蛋白亲和力预测值;根据该预测子任务中药物-靶蛋白亲和力的真实值和所述预测值计算该预测子任务的损失;根据所述每个预测子任务的查询集的预测损失,得到所有预测子任务的总体损失,所述总体损失包括所有子任务在查询集上的平均损失和一个正则化项,其中正则化项采用的是基尼系数。
2.根据权利要求1所述的药物-靶蛋白亲和力预测方法,其特征在于,
根据药物化学分子表示字典对药物化学分子进行编码得到药物输入表示;其中,药物化学分子的表示为简化分子线性输入规范,药物化学分子表示字典是多个无重复ASCII码,每个所述ASCII码对应一个自然数;根据药物化学分子表示字典将简化分子线性输入规范转换为数值序列,并将该序列长度固定;
根据靶蛋白分子表示字典对靶蛋白分子进行编码得到靶蛋白输入表示;其中,靶蛋白分子表示为蛋白序列,靶蛋白分子表示字典是多个无重复字符,每个所述字符对应一个自然数;根据靶蛋白分子表示字典将蛋白序列转换为数值序列,并将该序列长度固定。
3.根据权利要求1所述的药物-靶蛋白亲和力预测方法,其特征在于,得到任务自适应元学习神经网络预训练模型包括:
随机采样预测子任务数据集,其中每个预测子任务数据集中均包括支撑集和查询集,支撑集和查询集中的每一个样本均包括药物-靶蛋白对以及与之对应的药物-靶蛋白亲和力真实值;
对于每个预测子任务,使用该预测子任务中的支撑集训练任务自适应元学习神经网络,得到特定于该预测子任务的任务自适应元学习神经网络;
使用随机采集的所有预测子任务中的查询集训练特定于该预测子任务的任务自适应元学习神经网络,得到适用于所有预测子任务的任务自适应元学习神经网络预训练模型。
4.根据权利要求1所述的药物-靶蛋白亲和力预测方法,其特征在于,将测试集中的所有支撑集合并,得到药物输入表示和靶蛋白输入表示,输入至任务自适应元学习神经网络预训练模型,得到药物-靶蛋白亲和力预测值;根据所述药物-靶蛋白亲和力的真实值和预测值计算预测损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111130899.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于伺服电机健身器材的训练系统
- 下一篇:一种软包类电芯的无极变距夹爪