[发明专利]抗体-蛋白质结合亲和力预测模型的训练方法和装置在审
申请号: | 202210942145.8 | 申请日: | 2022-08-08 |
公开(公告)号: | CN115206415A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 杨雍逍;王攀 | 申请(专利权)人: | 香港中文大学(深圳) |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B40/00;G06N3/04 |
代理公司: | 深圳尚业知识产权代理事务所(普通合伙) 44503 | 代理人: | 杨勇 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抗体 蛋白质 结合 亲和力 预测 模型 训练 方法 装置 | ||
1.一种抗体-蛋白质结合亲和力预测模型的训练方法,其特征在于,包括:
获取抗体-蛋白质抗原复合物亲和力的数据集,并计算所述数据集中抗体-蛋白质抗原复合物的表面信息和界面信息;
以所述数据集中抗体-蛋白质抗原复合物的表面信息和界面信息对多个预测亲和力模型进行训练,其中,预测亲和力模型包括:预测亲和力的线性模型、预测亲和力的非线性模型和预测亲和力的混合模型;
对训练得到的多个预测亲和力模型行模型挑选得到抗体-蛋白质结合亲和力预测模型。
2.根据权利要求1所述的训练方法,其特征在于,抗体-蛋白质抗原复合物的实验结构的所述抗体-蛋白质抗原复合物亲和力的数据集为蛋白质或多肽,其中,抗体的氨基酸数目大于400,抗原的氨基酸数目大于25小于或等于抗体的氨基酸数目,且一个抗体只结合一个抗原,抗体包含重链和轻链。
3.根据权利要求1所述的训练方法,其特征在于,所述以所述数据集中抗体-蛋白质抗原复合物的表面信息和界面信息对多个预测亲和力模型进行训练,包括:
所述数据集包括训练集和测试集,其中,所述训练集包括用于模型训练的第一训练集和用于验证模型效果的第二训练集;
利用所述第一训练集对所述预测亲和力的线性模型、所述预测亲和力的非线性模型和预测亲和力的神经网络模型分别进行训练;
利用第二训练集对训练好的预测亲和力的线性模型、预测亲和力的非线性模型和预测亲和力的神经网络模型进行验证,并选取符合预设标准的多个预测亲和力的模型。
4.根据权利要求3所述的训练方法,其特征在于,还包括:
从训练好的预测亲和力的神经网络模型中选取预测结果大于预设值的模型进行线性拟合;
基于不同的神经网络预测结果的组合得到多个初始预测亲和力的混合模型,并利用所述训练集对多个初始预测亲和力的混合模型进行训练和验证,得到所述预测亲和力的混合模型。
5.根据权利要求3所述的训练方法,其特征在于,所述对训练得到的多个预测亲和力模型行模型挑选得到抗体-蛋白质结合亲和力预测模型,包括:
根据所述训练集和所述测试集对所述预测亲和力的线性模型、所述预测亲和力的非线性模型和所述预测亲和力的混合模型的预测效果选取符合预设预测值得模型作为抗体-蛋白质结合亲和力预测模型。
6.一种抗体-蛋白质结合亲和力预测模型的训练装置,其特征在于,包括:
获取模块,用于获取抗体-蛋白质抗原复合物亲和力的数据集,并计算所述数据集中抗体-蛋白质抗原复合物的表面信息和界面信息;
处理模块,用于以所述数据集中抗体-蛋白质抗原复合物的表面信息和界面信息对多个预测亲和力模型进行训练,其中,预测亲和力模型包括:预测亲和力的线性模型、预测亲和力的非线性模型和预测亲和力的混合模型;
执行模块,用于对训练得到的多个预测亲和力模型行模型挑选得到抗体-蛋白质结合亲和力预测模型。
7.根据权利要求6所述的训练装置,其特征在于,抗体-蛋白质抗原复合物的实验结构的所述抗体-蛋白质抗原复合物亲和力的数据集为蛋白质或多肽,其中,抗体的氨基酸数目大于400,抗原的氨基酸数目大于25小于或等于抗体的氨基酸数目,且一个抗体只结合一个抗原,抗体包含重链和轻链。
8.根据权利要求6所述的训练装置,其特征在于,所述数据集包括训练集和测试集,其中,所述训练集包括用于模型训练的第一训练集和用于验证模型效果的第二训练集;所述处理模块包括:
第一获取子模块,用于利用所述第一训练集对所述预测亲和力的线性模型、所述预测亲和力的非线性模型和预测亲和力的神经网络模型分别进行训练;
第一处理子模块,用于利用第二训练集对训练好的预测亲和力的线性模型、预测亲和力的非线性模型和预测亲和力的神经网络模型进行验证,并选取符合预设标准的多个预测亲和力的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于香港中文大学(深圳),未经香港中文大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210942145.8/1.html,转载请声明来源钻瓜专利网。