[发明专利]基于模糊谱聚类的不确定PPI网络功能模块挖掘方法有效
申请号: | 201811149953.9 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109545275B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 毛伊敏;刘银萍;毛丁慧 | 申请(专利权)人: | 江西理工大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00 |
代理公司: | 北京鼎承知识产权代理有限公司 11551 | 代理人: | 李伟波;韩德凯 |
地址: | 341000 江*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模糊 谱聚类 不确定 ppi 网络 功能模块 挖掘 方法 | ||
1.一种基于模糊谱聚类的不确定PPI网络功能模块挖掘方法,其特征在于,包括以下步骤:
构建不确定蛋白质相互作用网络图:去掉蛋白质相互作用数据中的重复相互作用和自相互作用,根据蛋白质相互作用网络图中连接每条边的两个节点的公共邻居节点数,以及所述两个节点度的最小值,利用边聚集系数来测度每一组相互作用,从而构建不确定蛋白质相互作用网络图;
预处理蛋白质相互作用数据:利用流行距离和蛋白质网络的拓扑特性来改进谱聚类算法的相似度度量,分别计算在所述网络图中的节点之间的相似度,形成相似度矩阵,进而采用谱聚类算法完成对所述蛋白质相互作用数据的预处理;
挖掘蛋白质相互作用功能模块:采用DPCS策略选取初始聚类中心,基于所述初始聚类中心,采用模糊C-均值算法不断更新聚类中心和隶属度,进而实现蛋白质相互作用功能模块的挖掘;其中,所述DPCS策略是基于密度的概率中心选取策略;
过滤所述蛋白质相互作用功能模块:利用期望稠密度融合边聚集系数的边期望稠密度来过滤挖掘出的所述蛋白质相互作用功能模块;以及
输出结果:输出预测挖掘出的蛋白质相互作用功能模块。
2.根据权利要求1所述的方法,其特征在于,所述边聚集系数通过下式1计算:
其中,ECC表示边聚集系数,Hc表示节点u和v的公共邻居节点,du和dv分别代表u节点和v节点的度。
3.根据权利要求1或2所述的方法,其特征在于,所述流行距离的计算公式如下式2所示:
其中,FD(b0,bs)表示不确定图上任意两个节点b0,bs之间的流行距离,Ros表示不确定图上连接两个节点的全部可能的到达路径集合,d(bk,bk+1)表示节点b0和bs间的欧氏距离,0≤k≤s,ρ(ρ1)表示伸缩因子。
4.根据权利要求3所述的方法,其特征在于,
所述相似度用下式3计算:
FEC(bi,bj)=ECC(bi,bj)×FD(bi,bj) 式3
其中,FEC(bi,bj)表示任意两个节点bi,bj之间的相似度,ECC(bi,bj)表示节点bi,bj的边聚集系数,FD(bi,bj)表示节点bi,bj之间的流行距离。
5.根据权利要求1所述的方法,其特征在于,采用DPCS策略选取初始聚类中心的步骤包括:
计算数据节点之间的相似度;
基于所述相似度计算样本的概率密度函数;
基于所述概率密度函数获取初始聚类中心。
6.根据权利要求5所述的方法,其特征在于,
所述概率密度函数通过下式4计算:
其中,表示对象zi处的概率密度函数,rd表示邻域半径,rd的数值是N个对象的平均距离度量;
所述邻域半径通过下式5计算:
其中,FEC(zi,zj)表示对象zi,zj之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西理工大学,未经江西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811149953.9/1.html,转载请声明来源钻瓜专利网。