[发明专利]基于迁移学习的赖氨酸丙酰化预测方法和系统有效

专利信息
申请号: 202110289477.6 申请日: 2021-03-18
公开(公告)号: CN112820350B 公开(公告)日: 2022-08-09
发明(设计)人: 黎昂;陈敏;谭艳;邓英伟;孙旭东 申请(专利权)人: 湖南工学院
主分类号: G16B20/30 分类号: G16B20/30;G06N3/08;G06N3/04
代理公司: 衡阳雁城专利代理事务所(普通合伙) 43231 代理人: 龙腾
地址: 421002 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 迁移 学习 赖氨酸 丙酰化 预测 方法 系统
【说明书】:

基于迁移学习的赖氨酸丙酰化预测方法和系统,涉及生物信息技术领域,本发明通过将已知的丙二酰化修饰数据直接输入到深度递归神经网络模型中进行训练,再利用丙酰化修饰数据对训练后的深度递归神经网络模型进行微调,上述经过训练和微调后的深度递归神经网络模型被作为特征提取器并将其最后第二层的输出视为丙酰化序列特征,并以支持向量机作为最终分类器,训练支持向量机并使用训练后的支持向量机模型预测丙酰化。本发明利用迁移学习手段解决了现有丙酰化样本数据太小无法较好地训练深度学习模型的问题,能够快速有效地对赖氨酸丙酰化修饰进行预测。

技术领域

本发明涉及生物信息技术领域,特别涉及一种基于迁移学习的赖氨酸丙酰化预测方法和系统。

背景技术

蛋白质丙酰化是2007年首次在组蛋白上发现的一种新型赖氨酸酰化修饰,丙酰基可以通过乙酰基转移酶来配合更大的酰基辅酶分子。目前的研究已经发现,一些乙酰基转移酶如PCF、P300、CBP可以催化丙酰化,而SIRT1和SIRT2则可以去除丙酰化修饰。现有研究表明,赖氨酸丙酰化在代谢过程中起调节作用,并是活性染色质的标志。

对修饰位点进行鉴定识别和系统分析是研究蛋白质PTM(翻译后修饰)的重要内容,鉴定丙酰化位点是进一步探索丙酰化蛋白在病理生理学中功能和作用的关键基础。传统用以鉴定丙酰化底物蛋白的方法有高通量质谱法(MS)、PTMap结合蛋白质序列比、混合MS纳米液相色谱相结合方法等。近些年来,利用计算识别PTM的工作研究取得了明显的进步,出现了各种类型的预测算法和系统,譬如通过将各种位置和组成的相对特征以及统计矩阵结合在一起用于赖氨酸巴豆酰化预测的方法,还有通过提取基于序列的理化特性和进化信息特征来预测原核生物赖氨酸乙酰化位点的方法等,但是很少见到有对赖氨酸丙酰化预测的方法和系统。另外,现有技术中将序列特征信息与特征筛选优化方法相结合的预测算法大多仅在“小”样本上受过训练,概括性较差,这意味着,即使其在实验数据集中达到较高的预测准确性,但实际精度很有可能会比实验精度差得多。

发明内容

本发明的目的之一是提供一种基于迁移学习的赖氨酸丙酰化预测方法,用于对赖氨酸丙酰化修饰进行快速有效的预测。

为了实现上述目的,本发明所涉基于迁移学习的赖氨酸丙酰化预测方法采用以下手段:

1)以经过已知赖氨酸丙二酰化修饰数据训练再通过已知赖氨酸丙酰化修饰数据微调的深度递归神经网络模型作为特征提取器;

2)以经过已知赖氨酸丙酰化蛋白序列特征进行参数优化和训练的支持向量机模型作为最终分类器;

3)利用特征提取器提取待分析蛋白的目标序列特征,并将提取的目标序列特征输入最终分类器中,对丙酰化修饰位点进行预测并输出预测结果。

其中,在步骤1)之前,还包括:构建深度递归神经网络模型,并将已知赖氨酸丙二酰化修饰数据输入深度递归神经网络模型对其进行训练的步骤;以及将已知赖氨酸丙酰化修饰数据输入训练后的深度递归神经网络模型对其进行微调的步骤。

其中,在步骤2)之前,还包括构建支持向量机,并将已知赖氨酸丙酰化蛋白序列分割成肽段序列,形成阳性和阴性样本集,以及通过特征提取器从阳性和阴性样本集中提取序列特征,再利用提取的序列特征优化支持向量机窗口大小和超参数并训练支持向量机模型的步骤。

进一步地,在对深度递归神经网络模型进行训练时,先将已知的赖氨酸丙二酰化蛋白分割成肽段序列,形成包含相应阳性和阴性样本集的赖氨酸丙二酰化修饰数据,再将赖氨酸丙二酰化修饰数据输入深度递归神经网络模型以对其进行训练。

进一步地,对训练后的深度递归神经网络模型进行微调时,先将已知的赖氨酸丙酰化蛋白分割成肽段序列,形成包含相应阳性和阴性样本集的赖氨酸丙酰化修饰数据,再将赖氨酸丙酰化修饰数据输入训练后的深度递归神经网络模型以对其进行微调。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工学院,未经湖南工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110289477.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top