[发明专利]基于迁移学习的赖氨酸丙酰化预测方法和系统有效
申请号: | 202110289477.6 | 申请日: | 2021-03-18 |
公开(公告)号: | CN112820350B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 黎昂;陈敏;谭艳;邓英伟;孙旭东 | 申请(专利权)人: | 湖南工学院 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G06N3/08;G06N3/04 |
代理公司: | 衡阳雁城专利代理事务所(普通合伙) 43231 | 代理人: | 龙腾 |
地址: | 421002 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 迁移 学习 赖氨酸 丙酰化 预测 方法 系统 | ||
1.基于迁移学习的赖氨酸丙酰化预测方法,其特征在于:
1)构建深度递归神经网络模型,将所述深度递归神经网络模型的框架设定为依次由嵌入层、第一双向长短时记忆网络层、双向门控循环单元层、第二双向长短时记忆网络层、退出层、扁平化层、完全连接层和输出层构成;
2)对深度递归神经网络模型进行训练,先将已知的赖氨酸丙二酰化蛋白分割成肽段序列,形成包含相应阳性和阴性样本集的赖氨酸丙二酰化修饰数据,再将赖氨酸丙二酰化修饰数据输入深度递归神经网络模型以对其进行训练;
3)对训练后的深度递归神经网络模型进行微调,先将已知的赖氨酸丙酰化蛋白分割成肽段序列,形成包含相应阳性和阴性样本集的赖氨酸丙酰化修饰数据,再将赖氨酸丙酰化修饰数据输入训练后的深度递归神经网络模型以对其进行微调;
4)以经过已知赖氨酸丙二酰化修饰数据训练再通过已知赖氨酸丙酰化修饰数据微调的深度递归神经网络模型作为特征提取器;
5)以经过已知赖氨酸丙酰化蛋白序列特征进行参数优化和训练的支持向量机模型作为最终分类器;
6)利用特征提取器提取待分析蛋白的目标序列特征,并将提取的目标序列特征输入最终分类器中,对丙酰化修饰位点进行预测并输出预测结果。
2.根据权利要求1所述的基于迁移学习的赖氨酸丙酰化预测方法,其特征在于,在步骤5)之前,还包括:
构建支持向量机,将已知赖氨酸丙酰化蛋白序列分割成肽段序列,形成阳性和阴性样本集,并通过特征提取器从阳性和阴性样本集中提取序列特征,再利用提取的序列特征优化支持向量机窗口大小和超参数并训练支持向量机模型的步骤。
3.根据权利要求1所述的基于迁移学习的赖氨酸丙酰化预测方法,其特征在于:步骤6)中,利用特征提取器提取待分析蛋白的目标序列特征是先将待分析蛋白序列分割成肽段序列,再利用特征提取器从肽段序列中提取目标序列特征。
4.根据权利要求2或3所述的基于迁移学习的赖氨酸丙酰化预测方法,其特征在于:在将各蛋白序列分割成肽段序列时,都是将对应的蛋白序列分割成以赖氨酸为中心且上游和下游各含有n个氨基酸残基的肽段;对于分割得到的上游和/或下游少于n个氨基酸残基的肽段,在对应肽段的前端和/或末端以字符“X”补齐;其中,n为大于等于1的自然数。
5.根据权利要求3所述的基于迁移学习的赖氨酸丙酰化预测方法,其特征在于:籍由所述嵌入层将输入的肽段序列的氨基酸字符整数索引转换成嵌入向量,并以完全连接层的输出作为要提取的序列特征。
6.基于迁移学习的赖氨酸丙酰化预测系统,其特征在于,包括:
特征提取器,所述特征提取器包括经过已知赖氨酸丙二酰化修饰数据训练再通过已知赖氨酸丙酰化修饰数据微调的深度递归神经网络模型;
最终分类器,所述最终分类器包括经过已知赖氨酸丙酰化序列特征进行参数优化和训练的支持向量机模型;
该赖氨酸丙酰化预测系统按照权利要求1-5中任意一项所述的赖氨酸丙酰化预测方法对待分析蛋白的丙酰化修饰位点进行预测并输出预测结果。
7.根据权利要求6所述的基于迁移学习的赖氨酸丙酰化预测系统,其特征在于,还包括:
序列分割器,用于将各蛋白序列分割成以赖氨酸为中心且上游和下游各含有n个氨基酸残基的肽段序列,并在分割得到的上游和/或下游少于n个氨基酸残基的肽段序列的前端和/或末端以字符“X”补齐;其中,n为大于等于1的自然数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工学院,未经湖南工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110289477.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种珍奇物品用高稳定型展示架
- 下一篇:一种带通电流保护电路