[发明专利]一种抗体结构预测的处理方法和装置有效
申请号: | 202310114453.6 | 申请日: | 2023-02-15 |
公开(公告)号: | CN115881220B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 刘旭阳;邓镇丰;顾睿初;温翰;张林峰;孙伟杰 | 申请(专利权)人: | 北京深势科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;G16B50/00;G06F18/214;G06N20/00 |
代理公司: | 北京慧诚智道知识产权代理事务所(特殊普通合伙) 11539 | 代理人: | 高梅 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 抗体 结构 预测 处理 方法 装置 | ||
1.一种抗体结构预测的处理方法,其特征在于,所述方法包括:
基于预设的多个迭代次数ni对抗体结构预测模型进行训练得到对应的多组结构预测模型参数;并对抗体结构评分模型进行训练;1≤i≤M,M为一个大于或等1的正整数;
获取抗体FV片段的残基序列作为对应的第一FV片段序列;所述第一FV片段序列包括第一重链残基序列、第一轻链残基序列;
对所述多组结构预测模型参数的所述结构预测模型参数进行遍历;并在遍历时,将当前遍历的所述结构预测模型参数作为对应的当前结构预测模型参数,并将所述抗体结构预测模型的模型参数设为所述当前结构预测模型参数,并将本次设置后的所述抗体结构预测模型作为对应的当前抗体结构预测模型;并将所述第一重链残基序列和所述第一轻链残基序列输入所述当前抗体结构预测模型进行FV片段三维结构预测处理得到对应的第一FV片段结构;
将得到的M个所述第一FV片段结构分别输入训练成熟的所述抗体结构评分模型进行置信度评分得到对应的第一结构评分;
从得到M个所述第一结构评分中选择最大评分对应的所述第一FV片段结构作为最优FV片段结构并输出;
其中,所述抗体结构预测模型为对AlphaFold-Multimer模型从机器学习框架JAX迁移到机器学习框架pytorch下并进行结构优化得到的预测模型;所述AlphaFold-Multimer模型为基于AlphaFold模型实现的多聚体结构预测模型;所述抗体结构预测模型和所述AlphaFold-Multimer模型的模型结构均与AlphaFold模型的模型结构一致;
所述抗体结构评分模型包括SEGNNs网络和加权池化模块;
所述基于预设的多个迭代次数ni对抗体结构预测模型进行训练得到对应的多组结构预测模型参数,具体包括:
基于所述AlphaFold-Multimer模型的多聚体结构预测模型训练方式对所述抗体结构预测模型进行训练并将训练完成的所述抗体结构预测模型作为对应的第一训练模型;
得到所述第一训练模型之后,再将蛋白质三维结构数据库中所有抗体结构数据提取出来组成对应的第一数据集;所述第一数据集包括多个第一抗体结构数据;所述第一抗体结构数据包括第一FV片段数据;所述第一FV片段数据包括第一片段残基序列和对应的第一片段三维结构标签;所述第一片段残基序列包括第一片段轻链残基序列和第一片段重链残基序列;所述第一片段三维结构标签包括第一片段原子集合和第一片段原子连接键集合;所述第一片段原子集合包括多个第一片段原子;每个所述第一片段原子对应一组原子特征数据,包括原子标识、原子名称、原子坐标、由元素类型和原子类型组成的原子元素类型、所属残基类型标识和原子电量;所述第一片段原子连接键集合包括多个第一片段原子连接键;每个所述第一片段原子连接键对应一组连接键信息,包括连接键标识、键首原子标识、键尾原子标识和连接键类型;
根据所述第一数据集进行二次训练数据集构建得到对应的第一训练数据集;所述第一训练数据集包括多个第一训练FV片段数据;所述第一训练FV片段数据包括第一训练片段轻链残基序列、第一训练片段重链残基序列和对应的第一训练片段三维结构标签;
根据各个所述迭代次数ni和所述第一训练数据集分别对所述第一训练模型进行二次训练得到对应的一组所述结构预测模型参数;并由得到的M个所述结构预测模型参数组成对应的所述多组结构预测模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深势科技有限公司,未经北京深势科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310114453.6/1.html,转载请声明来源钻瓜专利网。