[发明专利]蛋白质结构识别方法、训练方法及装置在审
申请号: | 202310433211.3 | 申请日: | 2023-04-21 |
公开(公告)号: | CN116434835A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 崔超;薛洋;方晓敏;张肖男 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;G06N3/0464;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 结构 识别 方法 训练 装置 | ||
本公开提供了蛋白质结构识别方法、训练方法及装置,涉及生物信息技术和人工智能技术领域,尤其涉及深度学习技术领域。该训练方法的具体实现方案为:利用掩码语言处理网络对样本蛋白质的氨基酸特征序列进行处理,得到包括氨基酸共进化信息的第一特征;利用关系图神经网络对样本蛋白质的空间结构特征进行处理,得到包括空间结构信息的第二特征;基于对比损失函数,根据第一特征和第二特征得到特征损失值;以及基于特征损失值,调整掩码语言处理网络和图神经网络的模型参数,得到经训练的深度学习模型。
技术领域
本公开涉及生物信息技术和人工智能技术领域,尤其涉及深度学习技术领域,具体涉及一种蛋白质结构识别方法、训练方法及装置。
背景技术
蛋白质是组成人体内的酶、激素、抗体等活性物质的基本单元。由于蛋白质的功能与蛋白质分子的空间结构紧密相关,因此,具有不同空间结构的蛋白质呈现出不同的理化性质,对蛋白质空间结构的准确识别在研究蛋白质的功能及作用机理具有重要意义。
发明内容
本公开提供了一种用于蛋白质结构识别方法、训练方法及装置。
根据本公开的一方面,提供了一种深度学习模型的训练方法,包括:利用掩码语言处理网络对样本蛋白质的氨基酸特征序列进行处理,得到包括氨基酸共进化信息的第一特征;利用关系图神经网络对样本蛋白质的空间结构特征进行处理,得到包括空间结构信息的第二特征;基于对比损失函数,根据第一特征和第二特征得到特征损失值;以及基于特征损失值,调整掩码语言处理网络和图神经网络的模型参数,得到经训练的深度学习模型。
根据本公开的另一方面,提供了一种蛋白质结构识别方法,包括:利用上述深度学习模型对待识别蛋白质的特征数据进行处理,得到包括氨基酸共进化信息和空间结构信息的特征序列,其中,特征数据包括以下至少之一:氨基酸特征序列和空间结构特征;以及对特征序列进行识别,得到待识别蛋白质的结构信息。
根据本公开的另一方面,提供了一种深度学习模型的训练装置,包括:第一处理模块、第二处理模块、对比损失模块和调整模块。第一处理模块,用于利用掩码语言处理网络对样本蛋白质的氨基酸特征序列进行处理,得到包括氨基酸共进化信息的第一特征。第二处理模块,用于利用关系图神经网络对样本蛋白质的空间结构特征进行处理,得到包括空间结构信息的第二特征。对比损失模块,用于基于对比损失函数,根据第一特征和第二特征得到特征损失值。调整模块,用于基于特征损失值,调整掩码语言处理网络和图神经网络的模型参数,得到经训练的深度学习模型。
根据本公开的另一方面,提供了一种蛋白质结构识别装置,包括:特征融合模块和特征识别模块。特征融合模块,用于上述深度学习模型对待识别蛋白质的特征数据进行处理,得到包括氨基酸共进化信息和空间结构信息的特征序列,其中,特征数据包括以下至少之一:氨基酸特征序列和空间结构特征。特征识别模块,用于对特征序列进行识别,得到待识别蛋白质的结构信息。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示意性示出了根据本公开实施例的可以应用深度学习模型的训练方法或蛋白质结构识别方法及装置的示例性系统架构;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310433211.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:膏状胶粘剂密度测试方法及装置
- 下一篇:碳资产数据的安全存储方法