[发明专利]一种蛋白质磷酸化位点识别方法、系统、装置及存储介质有效
申请号: | 201910569671.2 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110349628B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 李占潮;邹小勇;戴宗 | 申请(专利权)人: | 广东药科大学;中山大学 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G06N3/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 许飞 |
地址: | 510240 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白质 磷酸化 识别 方法 系统 装置 存储 介质 | ||
1.一种蛋白质磷酸化位点识别方法,其特征在于,包括以下步骤:
获取待识别蛋白质磷酸化位点的氨基酸序列片段;
对所述氨基酸序列片段中氨基酸的二进制编码进行逻辑操作,获得所述氨基酸序列片段的逻辑二进制特征向量;
根据预设的核函数,对所述逻辑二进制特征向量进行核主成分分析,获得核主成分逻辑二进制特征向量;
将所述核主成分逻辑二进制特征向量输入到随机森林模型中进行处理,获得所述蛋白质磷酸化位点的识别结果;
其中,所述对所述氨基酸序列片段中氨基酸的二进制编码进行逻辑操作,获得所述氨基酸序列片段的逻辑二进制特征向量,包括:
对所述氨基酸序列片段中氨基酸的二进制编码两两进行逻辑与操作,得到第一特征向量集;
对所述氨基酸序列片段中氨基酸的二进制编码两两进行逻辑或操作,得到第二特征向量集;
对所述氨基酸序列片段中氨基酸的二进制编码两两进行逻辑异或操作,得到第三特征向量集;
将所述第一特征向量集、所述第二特征向量集及所述第三特征向量集首尾连接,获得所述氨基酸序列片段的逻辑二进制特征向量。
2.根据权利要求1所述的蛋白质磷酸化位点识别方法,其特征在于,所述根据预设的核函数,对所述逻辑二进制特征向量进行核主成分分析,获得核主成分逻辑二进制特征向量,包括以下步骤:
根据预设的核函数将逻辑二进制特征向量映射到高维空间,获得高位空间核矩阵;
计算所述核矩阵的特征值及特征值的特征向量;
选取所述特征值中前k个较大特征值对应的特征向量进行首尾连接,获得所述氨基酸序列片段的核主成分逻辑二进制特征向量。
3.根据权利要求2所述的蛋白质磷酸化位点识别方法,其特征在于,所述核函数为高斯核函数。
4.根据权利要求1所述的蛋白质磷酸化位点识别方法,其特征在于,所述随机森林模型的构建方法包括以下步骤:
根据资料库中蛋白质磷酸化位点对应的蛋白质氨基酸序列,获取所述蛋白质磷酸化位点对应的核主成分逻辑二进制特征向量作为输入数据正样本,并将蛋白质磷酸化位点信息作为输出数据正样本;
根据资料库获取非蛋白质磷酸化位点对应的蛋白质氨基酸序列,获取所述非蛋白质磷酸化位点对应的核主成分逻辑二进制特征向量作为输入数据负样本,并将非蛋白质磷酸化位点信息作为输出数据负样本;
选取部分输入数据正样本、输入数据负样本、输出数据正样本以及输出数据负样本,对所述随机森林模型进行训练;
选取剩余的输入数据正样本、输入数据负样本及对应的输出结果,对所述随机森林模型进行测试。
5.根据权利要求4所述的蛋白质磷酸化位点识别方法,其特征在于,所述非蛋白质磷酸化位点,通过以下方法获得:
在蛋白质磷酸化位点所在的蛋白质序列中查找所有的赖氨酸残基;
当确定所述赖氨酸残基不是资料库中已标记的蛋白质磷酸化位点,则标记为非蛋白质磷酸化位点。
6.一种蛋白质磷酸化位点识别系统,其特征在于,包括:
序列获取模块,用于获取待识别蛋白质磷酸化位点的氨基酸序列片段;
第一向量获取模块,用于对所述氨基酸序列片段中氨基酸的二进制编码进行逻辑操作,获得所述氨基酸序列片段的逻辑二进制特征向量;
第二向量获取模块,用于根据预设的核函数,对所述逻辑二进制特征向量进行核主成分分析,获得核主成分逻辑二进制特征向量;
识别模块,用于将所述核主成分逻辑二进制特征向量输入到随机森林模型中进行处理,获得所述蛋白质磷酸化位点的识别结果;
其中,所述第一向量获取模块包括:
对所述氨基酸序列片段中氨基酸的二进制编码两两进行逻辑与操作,得到第一特征向量集;
对所述氨基酸序列片段中氨基酸的二进制编码两两进行逻辑或操作,得到第二特征向量集;
对所述氨基酸序列片段中氨基酸的二进制编码两两进行逻辑异或操作,得到第三特征向量集;
将所述第一特征向量集、所述第二特征向量集及所述第三特征向量集首尾连接,获得所述氨基酸序列片段的逻辑二进制特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东药科大学;中山大学,未经广东药科大学;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910569671.2/1.html,转载请声明来源钻瓜专利网。