[发明专利]基于模糊聚类和基因本体语义相似性的可重叠蛋白质复合物识别方法和系统有效
申请号: | 202110752082.5 | 申请日: | 2021-07-03 |
公开(公告)号: | CN113470738B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 胡伦;潘翔宇;周喜;蒋同海;苏小芮 | 申请(专利权)人: | 中国科学院新疆理化技术研究所 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/00 |
代理公司: | 乌鲁木齐中科新兴专利事务所(普通合伙) 65106 | 代理人: | 张莉 |
地址: | 830011 新疆维吾尔*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模糊 基因 本体 语义 相似性 重叠 蛋白质 复合物 识别 方法 系统 | ||
1.一种基于模糊聚类和基因本体语义相似性的可重叠蛋白质复合物识别方法,其特征在于按下列步骤进行:
a、对蛋白质相互作用数据和蛋白质基因本体语义信息构建成带有属性的蛋白质相互作用网络,其中包括:将蛋白质抽象为网络中的节点,蛋白质间若存在相互作用,则相应节点间存在边,并在此基础上统计与蛋白质相关的基因本体信息,获得包括所有节点构成的集合、节点之间边构成的集合以及与节点相关联的所有基因本体信息的集合;
b、根据步骤a所构建网络的拓扑信息,计算并获得网络所对应的邻接矩阵;
c、应用一种集成的基因本体语义相似性度量方法,计算蛋白质间的基因本体语义相似性,构建蛋白质的语义相似性矩阵;具体包括:
对于基因本体语义信息集合Λm的第p个和第q个基因本体术语tmp和tmq,通过集成的基因语义相似性度量方法计算,得到两个基因本体术语的语义相似度ISM(tmp,tmq),蛋白质vi在m类别中包含第p个术语,蛋白质vj在m类别中包含第q个术语,计算得到蛋白质vi和vj在某个语义类别m上的语义相似性
通过将每个语义类别上的语义相似性相加,得到蛋白质vi和vj间的语义相似性
d、初始化蛋白质复合物数量,初始化蛋白质复合物集合,并随机初始化蛋白质与复合物之间的隶属度矩阵;
e、初始化模型参数和蛋白质复合物重叠程度参数,基于步骤b所得节点的邻接矩阵、步骤c所得语义相似性矩阵和步骤d所得隶属度矩阵,构建关于隶属度矩阵的目标函数;
f、基于广义动量法,对步骤e所得目标函数进行求解,直至目标函数收敛,此时获得目标函数的解,即最佳的隶属度矩阵;
g、根据步骤f所得最佳的隶属度矩阵,结合步骤e所得蛋白质复合物重叠程度参数,将每个蛋白质划分到某个或某几个蛋白质复合物中,最后剔除空的蛋白质复合物,余下的复合物即为识别出的蛋白质复合物;
根据蛋白质间的语义相似性获得语义相似性矩阵S。
2.一种基于模糊聚类和基因本体语义相似性的可重叠蛋白质复合物识别系统,其特征在于该系统是由网络构建模块、数据预处理模块、参数定义模块、模型构建模块、模型求解模块、蛋白质复合物识别模块和结果展示模块组成,其中:
网络构建模块:将包含了蛋白质相互作用信息和蛋白质基因本体语义信息构建成为一个带属性的蛋白质相互作用网络;
数据预处理模块:根据结果展示模块中得到的网络进行数据预处理,获得蛋白质的邻接矩阵和蛋白质的语义相似性矩阵;所述数据预处理模块的处理过程具体包括:
对于基因本体语义信息集合Λm的第p个和第q个基因本体术语tmp和tmq,通过集成的基因语义相似性度量方法计算,得到两个基因本体术语的语义相似度ISM(tmp,tmq),蛋白质vi在m类别中包含第p个术语,蛋白质vj在m类别中包含第q个术语,计算得到蛋白质vi和vj在某个语义类别m上的语义相似性
通过将每个语义类别上的语义相似性相加,得到蛋白质vi和vj间的语义相似性
根据蛋白质间的语义相似性获得语义相似性矩阵S;
参数定义模块:定义并初始化模型参数,初始化蛋白质复合物重叠程度参数,初始化蛋白质复合物数量,初始化蛋白质对于复合物的隶属度矩阵;
模型构建模块:根据模型参数和数据预处理模块得到的邻接矩阵、语义相似性矩阵和参数定义模块所得隶属度矩阵,构建关于隶属度矩阵的目标函数;
模型求解模块:基于广义动量法,对模型构建模块所得的目标函数进行求解,直至目标函数收敛,此时获得目标函数的解,即最佳的隶属度矩阵;
蛋白质复合物识别模块:根据模型求解模块所得的最佳的隶属度矩阵和参数定义模块初始化的蛋白质复合物重叠程度参数,进行蛋白质复合物识别;
结果展示模块:将蛋白质复合物识别模块识别出的蛋白质复合物进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院新疆理化技术研究所,未经中国科学院新疆理化技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110752082.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电解液及其制备方法、锂离子电池
- 下一篇:软水再生结构、加湿器及软化再生方法