[发明专利]模型训练方法、蛋白质相互作用预测方法、装置和介质有效

专利信息
申请号: 202010277398.9 申请日: 2020-04-10
公开(公告)号: CN111613273B 公开(公告)日: 2023-03-28
发明(设计)人: 赵拴平;金海;李默;贾玉堂;徐磊 申请(专利权)人: 安徽省农业科学院畜牧兽医研究所
主分类号: G16B40/00 分类号: G16B40/00;G16B5/00
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 何文聪
地址: 230031 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模型 训练 方法 蛋白质 相互作用 预测 装置 介质
【说明书】:

发明公开了一种模型训练方法、蛋白质相互作用预测方法、装置和存储介质。模型训练方法包括获取由第一描述信息、第二描述信息和标签信息组成的训练数据,使用训练数据执行至少一次迭代操作,直至所述人工智能模型的损失函数满足收敛条件等步骤。通过对人工智能模型进行训练,可以使得人工智能模型具有获取不同蛋白质的序列信息之间相似性的能力,由于根据序列信息相似性来判断两种蛋白质之间是否能够发生相互作用,更符合蛋白质相互作用的机理,训练所得的人工智能模型能够准确地预测两种蛋白质之间是否能够发生相互作用,将人工智能模型用于预测蛋白质之间能否发生相互作用时,能够达到较高的准确率。本发明广泛应用于计算机技术领域。

技术领域

本发明涉及计算机技术领域,尤其是一种人工智能模型训练方法、蛋白质相互作用预测方法、装置和存储介质。

背景技术

蛋白质是生命的物质基础,其相互作用影响着基本细胞过程,对生物体内各种生理功能的实现具有重要影响,因此研究蛋白质之间的相互作用是一个重要课题。通过生物实验的方式研究蛋白质之间的相互作用,需要多次测定蛋白质对,会产生较高的时间成本和经费成本。因此,出现了通过计算方法来确定蛋白质之间是否发生相互作用的技术。一些现有技术是使用计算机编码算法将蛋白质序列数据进行特征向量化,然后使用经过学习和训练的分类器,根据特征向量预测蛋白之间是否发生相互作用。这些现有技术的局限性包括:预测结果依赖于对蛋白质序列数据进行特征向量化,也就是如果在开始时使用不同的计算机编码算法对蛋白质序列数据进行处理,最终得出的预测结果可能是不同的;预测相互作用所依赖的原理是对蛋白质的分类,但是蛋白质的种类繁多,现有技术对蛋白质只能做到粗糙分类,这使得现有技术最终得出的预测结果不可靠。

发明内容

针对上述至少一个技术问题,本发明的目的在于提供一种人工智能模型训练方法、蛋白质相互作用预测方法、装置和存储介质。

一方面,本发明实施例包括一种人工智能模型训练方法,包括以下步骤:

获取多组训练数据;所述训练数据包括用于描述第一蛋白质的第一描述信息、用于描述第二蛋白质的第二描述信息以及用于描述第一蛋白质和第二蛋白质之间是否发生相互作用的标签信息,所述第一描述信息由所述第一蛋白质的多个不同编码信息经处理得到,所述第二描述信息由所述第二蛋白质的多个不同编码信息经处理得到;

使用所述训练数据对所述人工智能模型进行迭代训练;所述迭代训练包括至少一次迭代操作;在每次所述迭代操作中,获取所述训练数据中的所述第一描述信息、第二描述信息和标签信息,将所述第一描述信息输入到所述人工智能模型以获取相应的第一特征信息,将所述第二描述信息输入到所述人工智能模型以获取相应的第二特征信息,获取所述第一特征信息与所述第二特征信息之间的距离,根据所述距离和所述标签信息,确定该次所述迭代操作对应的所述损失函数的值,根据所述损失函数的值更新所述人工智能模型的参数。

进一步地,人工智能模型训练方法还包括以下步骤:

获取所述第一蛋白质对应的第一序列信息,以及所述第二蛋白质对应的第二序列信息;

使用多个编码算法对所述第一序列信息进行处理,获取各所述编码算法分别输出的第一编码信息;

使用多个编码算法对所述第二序列信息进行处理,获取各所述编码算法分别输出的第二编码信息;

将各所述第一编码信息融合为所述第一描述信息,将各所述第二编码信息融合为所述第二描述信息;

从蛋白质相互作用数据库中,获取用于描述第一蛋白质和第二蛋白质之间是否发生相互作用的所述标签信息。

进一步地,所述将各所述第一编码信息融合为所述第一描述信息,将各所述第二编码信息融合为所述第二描述信息这一步骤,具体包括:

对至少一个所述第一编码信息进行线性插值,从而使所有所述第一编码信息的长度均为d1

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽省农业科学院畜牧兽医研究所,未经安徽省农业科学院畜牧兽医研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010277398.9/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top