[发明专利]一种基于二阶局部群落共同邻居比例和节点相关性的预测网络连边的方法在审
申请号: | 201710058276.9 | 申请日: | 2017-01-23 |
公开(公告)号: | CN106886679A | 公开(公告)日: | 2017-06-23 |
发明(设计)人: | 杨旭华;俞佳;项旗立 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 杭州斯可睿专利事务所有限公司33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于二阶局部群落共同邻居比例和节点相关性的预测网络连边的方法,建立网络模型,提取两个无连边节点的一阶和二阶共同邻居节点及其之间的边组成二阶局部群落,记录该群落的节点和边的总数,计算此群落的边聚类系数、简谐平均距离、连边密度和二阶局部群落系数。计算两个无连边节点间的皮尔逊积矩相关系数,计算共同邻居比例,计算两节点间的相似性指标,对整个网络任意两个无连边的节点,计算二者之间的相似性指标,将所有无连边节点对间的相似性分数按降序排列,取前h个指标对应的两个节点为预测连边。本发明考虑了节点之间的共同邻居比例、皮尔逊相关系数以及局部群落的内部属性,有效利用了网络的相关性信息,准确性较高,预测精度较高。 | ||
搜索关键词: | 一种 基于 局部 群落 共同 邻居 比例 节点 相关性 预测 网络 方法 | ||
【主权项】:
一种基于二阶局部群落共同邻居比例和节点相关性的预测网络连边的方法,其特征在于:包括如下步骤:步骤一:构建内部连通的无向无权网络G(V,E),E为连边,V为节点,其邻接矩阵用A表示;步骤二:任意选取网络G中两个无连边的节点i和j为两个种子节点,i和j之间路径长度为2的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,构成二阶局部群落,该群落的节点总数记为CNij,总连边数量记为SCSij,节点i和j的一阶和二阶邻居的总数分别记为Ti和Tj,其中与节点i或j的路径长度等于1的节点为其一阶邻居,与节点i或j的路径长度等于2的节点为其二阶邻居;步骤三:计算二阶局部群落的边聚类系数:Kij=SCSij/CNij*(CNij-1)2;]]>步骤四:计算二阶局部群落的简谐平均距离:其中,AVGij=1CNij*(CNij-1)/2Σg≠h1dgh;]]>上式中,g和h表示二阶局部群落中任意两个节点,dgh为g和h两个节点之间的路径长度;步骤五:计算二阶局部群落的连边密度:Dij=SCSij/CNij;步骤六:计算二阶局部群落系数:LCTij=Kij/L‾ij*Dij;]]>步骤七:计算节点i,j的皮尔逊积矩相关系数:Sij=Σk(Aik-<Ai>)(Ajk-<Aj>)Σk(Aik-<Ai>)2Σk(Ajk-<Aj>)2;]]>上式中,<Ai>表示邻接矩阵中第i行元素的均值其中n表示邻接矩阵A含n个节点;步骤八:计算两个节点i,j之间的相似性分数指标:HJCPij=LCTij/CNij*COSij/(Ti+Tj‑CNij)+λ*Sij;上式中,λ为可调参数;步骤九:遍历网络,针对所有未直接连接的节点对,重复步骤二至步骤八,计算相应的HJCP指标作为节点对之间的可能产生连边的评价指标,HAJCP指标越高,节点对之间越可能存在连边;将网络中所有的未直接相连的节点对之间的HJCP指标按照由高到低的顺序排列,取前h个HJCP指标对应的节点对为可能的预测连边,h≤H,其中H为网络中没有直接连边的节点对的总数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710058276.9/,转载请声明来源钻瓜专利网。
- 上一篇:医生诊疗辅助系统和方法
- 下一篇:一种超声远程实时会诊系统
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用