[发明专利]蛋白质亚细胞定位的空间蛋白质组学深度学习预测方法有效
申请号: | 202210757754.6 | 申请日: | 2022-06-30 |
公开(公告)号: | CN115064207B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 郭雪江;李妍;司徒成昊;王兵 | 申请(专利权)人: | 南京医科大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00;G06N3/0464;G06N3/08 |
代理公司: | 南京天华专利代理有限责任公司 32218 | 代理人: | 许轲;徐冬涛 |
地址: | 211166 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 细胞 定位 空间 深度 学习 预测 方法 | ||
1.一种蛋白质亚细胞定位的空间蛋白质组学深度学习预测方法,其特征在于包括以下步骤:
(1)基于蛋白质亚细胞分离组分定量的空间蛋白质组质谱数据,使用差分矩阵捕获每个蛋白质在不同亚细胞分离组分中的变化轨迹,从而构建特征图谱;具体为:
首先对每次重复实验中各蛋白质各组分表达水平进行归一化,再使用差分矩阵捕获每个蛋白质在不同亚细胞分离组分之间的变化轨迹,从而构建特征图谱;给定一个蛋白质p,存在f个组分n次重复实验,则通过差分矩阵构建的特征图谱xp如下:
其中:fip和fjp是蛋白质p第i个和第j个组分表达水平,e是超参数为1e-6,用于零值校正,tanh函数被用来约束xp的范围,特征图谱xp的范围为[-1,1],当ij时,则关注各组分之间表达水平的减数变化;i=j时,则关注各组分表达水平与平均水平的变异情况;当ij时,则关注各组分之间表达水平的倍数变化;
(2)利用卷积神经网络提取蛋白质特征图谱的深度图特征;
(3)利用卷积注意力机制模块CBAM对深度图特征进行自适应特征优化;
(4)以自适应优化特征为输入,使用深度神经网络来预测蛋白质亚细胞定位;
(5)使用已知亚细胞定位的蛋白质作为训练集进行五折交叉验证,对未知亚细胞定位的蛋白质进行预测;
(6)控制蛋白质亚细胞定位的错误发现率,获得高可信度的蛋白质亚细胞定位预测结果。
2.根据权利要求1所述的一种蛋白质亚细胞定位的空间蛋白质组学深度学习预测方法,其特征在于,所述步骤(2)中,以特征图谱xp为输入,使用卷积神经网络提取蛋白质特征图谱的深度图特征,其过程如下:
其中:Conv为卷积函数,BatchNorm为批量归一化函数,ReLU为整流线性函数,MaxPool为最大池化函数,xp依次经过卷积层-池化层-卷积层得到深度图特征O3p。
3.根据权利要求1所述的一种蛋白质亚细胞定位的空间蛋白质组学深度学习预测方法,其特征在于,所述卷积注意力机制模块包含的通道注意力机制CA和空间注意力机制SA函数分别如下:
其中:AvgPool为平均池化函数,MLP为多层感知机函数,Sigmoid为激活函数,CBAM通过CA和SA依次处理O3p,得到自适应优化特征O4p,操作如下:
其中:表示元素相乘,OFp是由通道注意力机制提取的通道优化特征。
4.根据权利要求1所述的一种蛋白质亚细胞定位的空间蛋白质组学深度学习预测方法,其特征在于,所述步骤(4)中,基于自适应优化特征展开作为输入,使用深度神经网络来预测蛋白质亚细胞定位,操作如下:
其中:Flatten为展开函数,Dense为稠密网络,Dropout为丢失层,Softmax为激活函数;自适应优化特征O4p首先被展开,再依次通过三层深度神经网络,输出蛋白质在各亚细胞中定位的预测概率y'p。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京医科大学,未经南京医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210757754.6/1.html,转载请声明来源钻瓜专利网。