[发明专利]泛素化位点的识别方法、装置、系统和存储介质有效
申请号: | 202210850486.2 | 申请日: | 2022-07-20 |
公开(公告)号: | CN114927165B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 李坚强;陈杰;陈廷柏 | 申请(专利权)人: | 深圳大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B15/20;G06N3/04;G06N3/08 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 罗敏 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 泛素化位点 识别 方法 装置 系统 存储 介质 | ||
本发明实施例公开了一种泛素化位点的识别方法、装置、系统和存储介质,属于泛素化技术领域,其方法包括获取蛋白质的三维结构信息;从所述三维结构信息提取出空间结构特征信息;基于训练完成的卷积模型对所述空间结构特征信息进行处理,得到赖氨酸节点的赖氨酸特征信息;所述卷积模型通过蛋白质训练集训练完成;若所述赖氨酸特征信息与预设的分类条件匹配,则对应的所述赖氨酸节点为泛素化位点。通过蛋白质的三维结构信息对蛋白质中各个赖氨酸是否能够泛素化进行识别,提高了识别精度。
技术领域
本发明涉及一种泛素化技术领域,尤其涉及一种泛素化位点的识别方法、装置、系统和存储介质。
背景技术
泛素化是真核细胞中一种常见的蛋白质后修饰方式,指泛素分子在泛素激活酶、泛素结合酶和泛素连接酶的相继作用下连接到靶蛋白分子的赖氨酸残基上。泛素化在蛋白质的定位、新陈代谢、细胞分裂、基因转录和DNA修复等方面具有重要作用,因此对泛素化位点的准确识别尤为重要。
现有技术中的泛素化位点识别方式为 DeepUbi模型,该模型由word2vec模型和卷积神经网络组成,从待测位点为中心的长度为31的蛋白质片段中学习嵌入特征,以推断是否能够泛素化。但上述方法仅考虑了蛋白质的序列特征,导致泛素化位点的识别精度下降。
发明内容
有鉴于此,本发明提供了一种泛素化位点的识别方法、装置、系统和存储介质,用于解决现有技术中的识别精度低的问题。为达上述之一或部分或全部目的或是其他目的,本发明提出一种泛素化位点的识别方法、装置、系统和存储介质,第一方面:
一种泛素化位点的识别方法,包括:
获取蛋白质的三维结构信息;
从所述三维结构信息提取出空间结构特征信息;
基于训练完成的卷积模型对所述空间结构特征信息进行处理,得到赖氨酸节点的赖氨酸特征信息;所述卷积模型通过蛋白质训练集训练完成;
若所述赖氨酸特征信息与预设的分类条件匹配,则对应的所述赖氨酸节点为泛素化位点。
优选地,通过所述蛋白质训练集训练所述卷积模型的步骤包括:
获取所述蛋白质训练集;所述蛋白质训练集中至少包含一组蛋白质样本信息和赖氨酸样本信息;
将所述蛋白质样本信息作为所述卷积模型的输入参数计算得到赖氨酸训练信息;
基于所述赖氨酸训练信息和所述赖氨酸样本信息计算得到权参数和训练特征参数;
基于所述权参数、所述训练特征参数和预设的加权损失函数模型计算得到损失值;
基于所述损失值和预设的训练条件判断是否完成训练;
在未完成所述卷积模型的训练时,迭代计算所述损失值;在完成所述卷积模型的训练时,停止迭代计算所述损失值。
优选地,所述将所述蛋白质样本信息作为所述卷积模型的输入参数计算得到赖氨酸训练信息的步骤包括:
通过第一卷积层对所述蛋白质样本信息进行计算,得到第一特征矩阵;所述蛋白质样本信息包括训练邻接矩阵和训练特征矩阵;
通过第二卷积层对所述训练邻接矩阵和所述第一特征矩阵进行计算,得到第二特征矩阵;
通过自注意力机制层对所述第二特征矩阵进行计算,得到第三特征矩阵;
通过第三卷积层对所述训练邻接矩阵和所述第三特征矩阵进行计算,得到蛋白质训练信息;
从所述蛋白质训练信息中筛选出所述赖氨酸训练信息。
优选地,所述基于所述赖氨酸训练信息和所述赖氨酸样本信息计算得到权参数和训练特征参数的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210850486.2/2.html,转载请声明来源钻瓜专利网。