[发明专利]一种基于混合隶属度随机块模型的蛋白质相互作用预测方法和系统有效
申请号: | 202110752120.7 | 申请日: | 2021-07-03 |
公开(公告)号: | CN113470739B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 胡伦;王小娟;周喜;蒋同海;苏小芮 | 申请(专利权)人: | 中国科学院新疆理化技术研究所 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/00 |
代理公司: | 乌鲁木齐中科新兴专利事务所(普通合伙) 65106 | 代理人: | 张莉 |
地址: | 830011 新疆维吾尔*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 隶属 随机 模型 蛋白质 相互作用 预测 方法 系统 | ||
本发明公开了一种基于混合隶属度随机块模型的蛋白质相互作用预测方法和系统,该系统由数据处理模块、复合物隶属度计算模块和结果生成模块组成,基于随机块的蛋白质相互作用预测方法,从数据库中获取蛋白质相互作用数据,对获得的数据进行处理;应用随机变分推理对蛋白质相互作用网络进行分析,计算复合物隶属度指标;基于复合物隶属度指标的计算结果,对蛋白质相互作用进行预测,展示预测结果。该系统通过混合隶属度随机块模型以及复合物识别方法,分析蛋白质相互作用网络,预测蛋白质相互作用,并展示相关预测结果,提高预测准确度。
技术领域
本发明涉及计算机数据处理技术领域,具体涉及一种基于混合隶属度随机块模型的蛋白质相互作用预测方法和系统。
背景技术
研究蛋白质之间的相互作用对于了解生物体内各项生化反应和生命活动的机制原理具有重要意义。随着计算机技术的飞速发展,蛋白质相互作用网络不断壮大,涵盖了大量的相互作用信息,构成了复杂的网络结构,同时也吸引了越来越多基于网络的蛋白质相互作用预测研究。目前大量基于网络预测蛋白质相互作用的方法主要是利用蛋白质相互作用网络中蛋白质间拓扑结构相似性,其中主要方法就是根据两个蛋白质之间的共同邻居数量判断它们之间是否存在相互作用,该算法被称作共同邻居算法,其核心思想是如果两个蛋白质之间具有足够多的相互作用邻居,那么它们就越有可能发生相互作用。
但是,在实际应用中,现有的基于网络的蛋白质相互作用预测方法效果欠佳,主要原因是这一类方法只是考虑了蛋白质在网络中的局部信息,无法充分挖掘整个网络中的链接模式。同时,最新的研究指出如果两个蛋白质具有足够多的相互作用邻居,那么只能说明它们的相互作用位点相似度很高,而不能说明它们之间具有相互作用。相反,给定两个蛋白质,只有在它们中的一个蛋白质与另一个蛋白质的相互作用伙伴相似的情况下,这两个给定的蛋白质才会发生相互作用。显然,现有方法单纯聚焦于蛋白质相互作用网络局部信息,忽视了网络全局信息,从而无法在蛋白质相互作用预测的准确性上满足实际应用的需求。
发明内容
本发明目的在于,针对现有技术存在的缺陷,提供一种基于混合隶属度随机块模型的蛋白质相互作用预测方法和系统。该方法从数据库中获取蛋白质相互作用数据,对获得的数据进行处理;应用随机变分推理对蛋白质相互作用网络进行分析,计算复合物隶属度指标;基于复合物隶属度指标的计算结果,对蛋白质相互作用进行预测,展示预测结果。所述系统由数据处理模块、复合物隶属度计算模块和结果生成模组成,通过混合隶属度随机块模型以及复合物识别方法,分析蛋白质相互作用网络,预测蛋白质相互作用,并展示相关预测结果,提高预测准确度。
本发明所述的一种基于混合隶属度随机块模型的蛋白质相互作用预测方法,按下列步骤进行:
a、从数据库中获取蛋白质相互作用数据,对数据进行预处理,得到由0和1构成的二维矩阵以表示蛋白质间已知的相互作用网络,在该网络中,节点表示蛋白质,节点之间的边则表示蛋白质间的相互作用关系,若两蛋白质之间具有相互作用则边为1;反之,则为0;
b、应用随机变分推理对蛋白质相互作用网络进行分析,计算蛋白质复合物隶属度指标;其中:
为每个蛋白质分配复合物隶属度向量πi,服从狄利克雷分布,πi~Dirichelet(α),具体公式为:
为网络中每个复合物分配权重βk,服从贝塔分布,βk~Beta(η),具体公式为:
使用随机变分推理对所得参数进行更新;
最终得到两个重要的复合物相关性指标:复合物隶属度向量π和复合物权重向量βk;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院新疆理化技术研究所,未经中国科学院新疆理化技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110752120.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种己内酰胺的制备方法
- 下一篇:一种基于流量预测的卫星网络队列管理方法