[发明专利]基于半监督网络嵌入模型的蛋白质复合体检测方法与装置有效
申请号: | 201711250342.9 | 申请日: | 2017-12-01 |
公开(公告)号: | CN108171010B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 朱佳;黄昌勤 | 申请(专利权)人: | 华南师范大学;广州凡平电子科技有限公司 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00;G06K9/62 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510631 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 网络 嵌入 模型 蛋白质 复合体 检测 方法 装置 | ||
本发明公开了基于半监督网络嵌入模型的蛋白质复合体检测方法和装置,所述方法包括获取蛋白质相互作用交互网络的邻接矩阵,对邻接矩阵进行嵌入处理,从而得到降维矩阵,利用聚类算法对降维矩阵进行处理,从而得到蛋白质复合体检测结果等步骤,所述装置包括用于存储至少一个程序存储器以及用于加载所述至少一个程序以执行基于半监督网络嵌入模型的蛋白质复合体检测方法的处理器。本发明通过对蛋白质相互作用交互网络对应的邻接矩阵进行维度转化,再交由聚类算法处理,提高了聚类处理的效果。本发明基于半监督网络嵌入模型的蛋白质复合体检测方法和装置广泛应用于蛋白质复合体识别技术领域。
技术领域
本发明涉及蛋白质复合体识别技术领域,尤其是基于半监督网络嵌入模型的蛋白质复合体检测方法与装置。
背景技术
蛋白质复合体是蛋白质相互作用(Protein-protein interaction,PPI)所形成的复杂的图结构,在生化过程和制药工艺中扮演着至关重要的角色。因此,正确地识别PPI交互网络中的蛋白质复合体,对于生物医学领域极为有用。不过,随着PPI数据的巨大增长,又加之实验方法的瓶颈制约,仅有少量的蛋白质复合体通过实验被识别。
为克服蛋白质复合体检测中实验方法的技术限制,人们使用了计算方法。PPI交互网络可看做是一个无向的非加权图,其中,蛋白质是顶点,它们的相互作用是边。每个蛋白质复合体由两个或更多的表现为密集相连的子图的蛋白质构成,这意味着,可以利用基于聚类方法形成的图来发现它们。
近来,网络嵌入被人们广泛加以研究,并证实其可进一步改善许多图聚类方法的性能。网络向量学习网络中顶点的低维表示,用以捕捉和保存该网络结构。不过,大部分现有的网络向量方法严重依赖网络中每个顶点的特征,这使得它们不适用于PPI交互网络。PPI交互网络中,除了蛋白质名称之外,没有任何元数据与每个顶点相关。换言之,现有的网络向量方法无法完全捕捉PPI交互网络结构,因为没有足够的资料能用来计算其一阶估计和二阶估计。
发明内容
为了解决上述技术问题,本发明的第一目的在于提供基于半监督网络嵌入模型的蛋白质复合体检测方法,第二目的在于提供基于半监督网络嵌入模型的蛋白质复合体检测装置。
本发明所采取的第一技术方案是:
基于半监督网络嵌入模型的蛋白质复合体检测方法,包括以下步骤:
获取蛋白质相互作用交互网络的邻接矩阵;
对邻接矩阵进行嵌入处理,从而得到降维矩阵;
利用聚类算法对降维矩阵进行处理,从而得到蛋白质复合体检测结果。
进一步地,所述对邻接矩阵进行嵌入处理,从而得到降维矩阵这一步骤,具体包括:
计算蛋白质相互作用交互网络中所有任意两点之间的一阶估计,从而得到蛋白质相互作用交互网络的局部结构信息;
计算蛋白质相互作用交互网络中所有任意两点之间的二阶估计,从而得到蛋白质相互作用交互网络的总体结构信息;
将局部结构信息和总体结构信息保存到邻接矩阵中,从而得到降维矩阵。
进一步地,所述计算蛋白质相互作用交互网络中所有任意两点之间的一阶估计,从而得到蛋白质相互作用交互网络的局部结构信息这一步骤,具体包括:
利用邻点选择算法选择出蛋白质相互作用交互网络中的每一个顶点的优选邻点集;
分别根据每一个顶点的优选邻点集,为每一个顶点赋予特征信息,从而建立特征信息矩阵;
根据特征信息矩阵,计算蛋白质相互作用交互网络中所有任意两点之间的一阶估计;
将蛋白质相互作用交互网络中所有任意两点之间的一阶估计作为所需获取的蛋白质相互作用交互网络的局部结构信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学;广州凡平电子科技有限公司,未经华南师范大学;广州凡平电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711250342.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种连铸坯枝晶生长方向的预测方法
- 下一篇:一种DNA复杂结构变异探测方法