[发明专利]基于半监督网络嵌入模型的蛋白质复合体检测方法与装置有效
申请号: | 201711250342.9 | 申请日: | 2017-12-01 |
公开(公告)号: | CN108171010B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 朱佳;黄昌勤 | 申请(专利权)人: | 华南师范大学;广州凡平电子科技有限公司 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00;G06K9/62 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510631 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于半监督网络嵌入模型的蛋白质复合体检测方法和装置,所述方法包括获取蛋白质相互作用交互网络的邻接矩阵,对邻接矩阵进行嵌入处理,从而得到降维矩阵,利用聚类算法对降维矩阵进行处理,从而得到蛋白质复合体检测结果等步骤,所述装置包括用于存储至少一个程序存储器以及用于加载所述至少一个程序以执行基于半监督网络嵌入模型的蛋白质复合体检测方法的处理器。本发明通过对蛋白质相互作用交互网络对应的邻接矩阵进行维度转化,再交由聚类算法处理,提高了聚类处理的效果。本发明基于半监督网络嵌入模型的蛋白质复合体检测方法和装置广泛应用于蛋白质复合体识别技术领域。 | ||
搜索关键词: | 基于 监督 网络 嵌入 模型 蛋白质 复合体 检测 方法 装置 | ||
获取蛋白质相互作用交互网络的邻接矩阵;
对邻接矩阵进行嵌入处理,从而得到降维矩阵;
利用聚类算法对降维矩阵进行处理,从而得到蛋白质复合体检测结果。
2.根据权利要求1所述的基于半监督网络嵌入模型的蛋白质复合体检测方法,其特征在于,所述对邻接矩阵进行嵌入处理,从而得到降维矩阵这一步骤,具体包括:计算蛋白质相互作用交互网络中所有任意两点之间的一阶估计,从而得到蛋白质相互作用交互网络的局部结构信息;
计算蛋白质相互作用交互网络中所有任意两点之间的二阶估计,从而得到蛋白质相互作用交互网络的总体结构信息;
将局部结构信息和总体结构信息保存到邻接矩阵中,从而得到降维矩阵。
3.根据权利要求2所述的基于半监督网络嵌入模型的蛋白质复合体检测方法,其特征在于,所述计算蛋白质相互作用交互网络中所有任意两点之间的一阶估计,从而得到蛋白质相互作用交互网络的局部结构信息这一步骤,具体包括:利用邻点选择算法选择出蛋白质相互作用交互网络中的每一个顶点的优选邻点集;
分别根据每一个顶点的优选邻点集,为每一个顶点赋予特征信息,从而建立特征信息矩阵;
根据特征信息矩阵,计算蛋白质相互作用交互网络中所有任意两点之间的一阶估计;
将蛋白质相互作用交互网络中所有任意两点之间的一阶估计作为所需获取的蛋白质相互作用交互网络的局部结构信息。
4.根据权利要求3所述的基于半监督网络嵌入模型的蛋白质复合体检测方法,其特征在于,所述计算蛋白质相互作用交互网络中所有任意两点之间的二阶估计,从而得到蛋白质相互作用交互网络的总体结构信息这一步骤,具体包括:将邻接矩阵和特征信息矩阵输入到图卷积神经网络中处理,从而输出蛋白质相互作用交互网络中所有任意两点之间的二阶估计;
将蛋白质相互作用交互网络中所有任意两点之间的二阶估计作为所需获取的蛋白质相互作用交互网络的总体结构信息。
5.根据权利要求3或4所述的基于半监督网络嵌入模型的蛋白质复合体检测方法,其特征在于,所述利用邻点选择算法选择出蛋白质相互作用交互网络中的每一个顶点的优选邻点集这一步骤,具体包括:利用Deepwalk算法对蛋白质相互作用交互网络进行处理,从而得到每一个顶点的Deepwalk向量;
选定蛋白质相互作用交互网络中的一个顶点作为对象顶点;
根据对象顶点和对象顶点的所有邻点的Deepwalk向量,分别计算对象顶点与其每一个邻点的欧几里得距离;
计算对象顶点与其每一个邻点的欧几里得距离的算术平均数;
将所有与对象顶点的欧几里得距离大于算术平均数的邻点组成的集合作为对象顶点的优选邻点集;
返回执行所述选定蛋白质相互作用交互网络中的一个顶点作为对象顶点这一步骤,直至选择出蛋白质相互作用交互网络中的每一个顶点的优选邻点集为止。
6.根据权利要求4所述的基于半监督网络嵌入模型的蛋白质复合体检测方法,其特征在于,所述计算蛋白质相互作用交互网络中所有任意两点之间的二阶估计,从而得到蛋白质相互作用交互网络的总体结构信息这一步骤之后,设有优化步骤,所述优化步骤包括:根据蛋白质相互作用交互网络中所有任意两点之间的一阶估计和二阶估计,计算图拉普拉斯正则项损失函数;
动态调整特征信息矩阵的阶数,直至图拉普拉斯正则项损失函数最小化;
将根据图拉普拉斯正则项损失函数最小时对应的一阶估计和二阶估计分别作为所需获取的蛋白质相互作用交互网络的局部结构信息和总体结构信息。
7.根据权利要求6所述的基于半监督网络嵌入模型的蛋白质复合体检测方法,其特征在于,所述图拉普拉斯正则项损失函数,其计算公式如下所示:L=Lfirst+λLsecond
式中,L为图拉普拉斯正则项损失函数,Lfirst为一阶估计被监控的损失,Lsecond为二阶估计被监控的损失,λ为Lfirst和Lsecond之间的均衡因子。
8.根据权利要求7所述的基于半监督网络嵌入模型的蛋白质复合体检测方法,其特征在于,所述一阶估计被监控的损失,其计算公式如下所示:式中,vi和vj是蛋白质相互作用交互网络中由一条边连接的一对顶点,yi是由vi的Deepwalk向量建立的矩阵,yj是由vj的Deepwalk向量建立的矩阵;
所述二阶估计被监控的损失,其计算公式如下所示:
式中,L0为图卷积神经网络的卷积层层数,H(0)=N×D,
9.根据权利要求4所述的基于半监督网络嵌入模型的蛋白质复合体检测方法,其特征在于,所述计算蛋白质相互作用交互网络中所有任意两点之间的二阶估计,从而得到蛋白质相互作用交互网络的总体结构信息这一步骤之后,设有优化步骤,所述优化步骤包括:动态调整α和β,使得下列方程组中Z等于0或最大限度地接近0:
式中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学;广州凡平电子科技有限公司,未经华南师范大学;广州凡平电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711250342.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种连铸坯枝晶生长方向的预测方法
- 下一篇:一种DNA复杂结构变异探测方法