[发明专利]模型训练方法、蛋白质相互作用预测方法、装置和介质有效
申请号: | 202010277398.9 | 申请日: | 2020-04-10 |
公开(公告)号: | CN111613273B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 赵拴平;金海;李默;贾玉堂;徐磊 | 申请(专利权)人: | 安徽省农业科学院畜牧兽医研究所 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B5/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 何文聪 |
地址: | 230031 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 蛋白质 相互作用 预测 装置 介质 | ||
1.一种人工智能模型训练方法,其特征在于,包括以下步骤:
获取多组训练数据;所述训练数据包括用于描述第一蛋白质的第一描述信息、用于描述第二蛋白质的第二描述信息以及用于描述第一蛋白质和第二蛋白质之间是否发生相互作用的标签信息,所述第一描述信息由所述第一蛋白质的多个不同编码信息经处理得到,所述第二描述信息由所述第二蛋白质的多个不同编码信息经处理得到;
使用所述训练数据对所述人工智能模型进行迭代训练;所述迭代训练包括至少一次迭代操作;在每次所述迭代操作中,获取所述训练数据中的所述第一描述信息、第二描述信息和标签信息,将所述第一描述信息输入到所述人工智能模型以获取相应的第一特征信息,将所述第二描述信息输入到所述人工智能模型以获取相应的第二特征信息,获取所述第一特征信息与所述第二特征信息之间的距离,根据所述距离和所述标签信息,确定该次所述迭代操作对应的损失函数的值,根据所述损失函数的值更新所述人工智能模型的参数。
2.根据权利要求1所述的人工智能模型训练方法,其特征在于,还包括以下步骤:
获取所述第一蛋白质对应的第一序列信息,以及所述第二蛋白质对应的第二序列信息;
使用多个编码算法对所述第一序列信息进行处理,获取各所述编码算法分别输出的第一编码信息;
使用多个编码算法对所述第二序列信息进行处理,获取各所述编码算法分别输出的第二编码信息;
将各所述第一编码信息融合为所述第一描述信息,将各所述第二编码信息融合为所述第二描述信息;
从蛋白质相互作用数据库中,获取用于描述第一蛋白质和第二蛋白质之间是否发生相互作用的所述标签信息。
3.根据权利要求2所述的人工智能模型训练方法,其特征在于,所述将各所述第一编码信息融合为所述第一描述信息,将各所述第二编码信息融合为所述第二描述信息这一步骤,具体包括:
对至少一个所述第一编码信息进行线性插值,从而使所有所述第一编码信息的长度均为d1;
对至少一个所述第二编码信息进行线性插值,从而使所有所述第二编码信息的长度均为d1;所述d1为进行线性插值之前各所述第一编码信息和第二编码信息的长度中的最大值;
将各所述第一编码信息进行归一化后并列成为所述第一描述信息;
将各所述第二编码信息进行归一化后并列成为所述第二描述信息。
4.根据权利要求1-3任一项所述的人工智能模型训练方法,其特征在于,所述人工智能模型为Siamese网络,所述Siamese网络包括依次连接的卷积层、池化层、第一全连接层和第二全连接层,所述卷积层和所述第一全连接层由ReLU函数激活。
5.根据权利要求1-3任一项所述的人工智能模型训练方法,其特征在于,所述损失函数为:
/
其中,N表示所述训练数据的总组数,yj表示第j组所述训练数据中的标签信息,yj=0表示第j组所述训练数据中的第一蛋白质和第二蛋白质之间不发生相互作用,yj=1表示第j组所述训练数据中的第一蛋白质和第二蛋白质之间发生相互作用,Dj表示第j组所述训练数据中所述第一特征信息与所述第二特征信息所确定的欧氏距离,m表示设定的第一阈值。
6.一种蛋白质相互作用预测方法,其特征在于,包括以下步骤:
获取用于描述第三蛋白质的第三描述信息,以及用于描述第四蛋白质的第四描述信息;所述第三描述信息由所述第三蛋白质的多个不同编码信息经处理得到,所述第四描述信息由所述第四蛋白质的多个不同编码信息经处理得到;
将所述第三描述信息输入到所述人工智能模型以获取相应的第三特征信息,将所述第四描述信息输入到所述人工智能模型以获取相应的第四特征信息;所述人工智能模型经过如权利要求1-5任一项所述的训练方法训练;
确定所述第三特征信息和所述第四特征信息之间的距离;
将所述距离与设定的第二阈值进行比较;
根据比较结果,确定所述第三蛋白质和所述第四蛋白质之间是否发生相互作用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽省农业科学院畜牧兽医研究所,未经安徽省农业科学院畜牧兽医研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010277398.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光纤微流流速传感器
- 下一篇:一种彩灯位置识别方法、系统、装置及存储介质