[发明专利]蛋白质表示模型预训练、蛋白质相互作用预测方法和装置有效
申请号: | 202111423752.5 | 申请日: | 2021-11-26 |
公开(公告)号: | CN114333982B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 薛洋;刘子敬;方晓敏;王凡;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B40/00;G16B30/00;G16B20/00;G16B15/20 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 单冠飞 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 表示 模型 训练 相互作用 预测 方法 装置 | ||
本公开提供了一种蛋白质表示模型预训练、蛋白质相互作用预测方法和装置,涉及人工智能技术领域,具体为自然语言处理、深度学习技术领域。具体实现方案为:获取蛋白质的氨基酸序列、功能信息和结构信息,根据上述氨基酸的序列、功能信息和结构信息,对蛋白质表示模型进行预训练。由此,提供了一种基于多模态蛋白质表示模型的预训练方式。
技术领域
本公开涉及人工智能技术领域,具体为自然语言处理、深度学习技术领域,尤其涉及蛋白质表示模型预训练、蛋白质相互作用预测方法和装置。
背景技术
预测蛋白质间相互作用对疫苗设计、抗体药物设计、多肽药物设计等应用有重大意义。在对蛋白质间相互作用进行预测的过程中,蛋白质的表示的准确程度直接影响着蛋白质间相互作用的预测结果。
发明内容
本公开提供了一种蛋白质表示模型预训练、蛋白质相互作用预测方法和装置。
根据本公开的一方面,提供了一种蛋白质表示模型预训练方法,所述方法包括:获取蛋白质的氨基酸序列、功能信息和结构信息;根据所述氨基酸序列、所述功能信息和所述结构信息,对所述蛋白质表示模型进行预训练。
本申请实施例的蛋白质表示模型预训练方法,获取蛋白质的氨基酸序列、功能信息和结构信息,根据上述氨基酸的序列、功能信息和结构信息,对蛋白质表示模型进行预训练。由此,提供了一种对蛋白质表示模型进行预训练的方式,从而可使得训练出的蛋白质表示模型准确。
根据本公开的另一方面,提供了一种蛋白质相互作用预测方法,所述方法包括:获取待处理的多个蛋白质以及各个所述蛋白质对应的氨基酸序列、功能信息和结构信息;基于各个所述蛋白质对应的氨基酸序列、功能信息和结构信息,通过预训练所得到的蛋白质表示模型,得到各个所述蛋白质对应的融合表示向量;将各个所述蛋白质对应的融合表示向量输入至蛋白质相互作用预测模型,以对多个所述蛋白质相互作用进行预测,以得到蛋白质相互作用预测结果。
本公开实施例的蛋白质相互作用预测方法,通过预训练所得到的蛋白质表示模型对各个蛋白质对应的氨基酸序列、功能信息和结构信息进行融合表示,以得到各个蛋白质对应的融合表示向量,并将各个所述蛋白质对应的融合表示向量输入至蛋白质相互作用预测模型,以对多个所述蛋白质相互作用进行预测,以得到蛋白质相互作用预测结果。由此,在准确的蛋白质的融合表示向量的基础上,使得蛋白质相互作用预测模型可以有更好的预测精度、鲁棒性和泛化性。
根据本公开的另一方面,提供了一种蛋白质表示模型的预训练装置,所述装置包括:获取模块,用于获取蛋白质的氨基酸序列、功能信息和结构信息;第一预训练模块,用于根据所述氨基酸序列、所述功能信息和所述结构信息,对所述蛋白质表示模型进行预训练。
根据本公开的另一方面,提供了一种蛋白质相互作用预测装置,所述装置包括:获取模块,用于获取待处理的多个蛋白质以及各个所述蛋白质对应的氨基酸序列、功能信息和结构信息;表示模块,用于基于各个所述蛋白质对应的氨基酸序列、功能信息和结构信息,通过上述预训练所得到的蛋白质表示模型,得到各个所述蛋白质对应的融合表示向量;相互作用预测模块,用于将各个所述蛋白质对应的融合表示向量输入至蛋白质相互作用预测模型,以对多个所述蛋白质相互作用进行预测,以得到蛋白质相互作用预测结果。根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的蛋白质表示模型的预训练方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的蛋白质表示模型的预训练方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本公开的蛋白质表示模型的预训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111423752.5/2.html,转载请声明来源钻瓜专利网。