[发明专利]用于评估蛋白复合体之间的相互作用的方法和设备无效
申请号: | 200610136696.6 | 申请日: | 2006-10-31 |
公开(公告)号: | CN101082942A | 公开(公告)日: | 2007-12-05 |
发明(设计)人: | 山川宏;丸桥弘治;仲尾由雄 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06F17/30;G01N33/50 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 李辉 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 评估 蛋白 复合体 之间 相互作用 方法 设备 | ||
1、一种对蛋白复合体之间的相互作用进行评估的方法,该方法包括以下步骤:
亚单位提取步骤,其从表示包括其间具有相互作用的一对蛋白复合体的蛋白复合体对的一组成对信息中,提取由在形成所述蛋白复合体的多个蛋白质中的具有类似性质的多个蛋白质构成的亚单位;
确定步骤,其确定所述亚单位中包括的蛋白质的蛋白质属性信息是否存在于标识蛋白质属性的一组蛋白质属性信息中;
创建步骤,其通过对与在所述确定步骤处确定的蛋白质属性信息的存在或不存在有关的信息进行聚合,创建标识针对每一条所述蛋白质属性信息的亚单位的属性的亚单位属性信息;
生成步骤,其生成包括与所述亚单位属性信息的存在或不存在有关的信息和标识针对每一条所述复合体对信息的所述相互作用的相互作用属性信息的学习数据,以覆盖由引起所述相互作用的蛋白复合体中的亚单位和接收所述相互作用的蛋白复合体中的亚单位的组合所形成的所有亚单位对;以及
预测规则提取步骤,其从将所述亚单位属性信息定义为条件并将所述相互作用属性信息定义为结论的多个规则构成的规则集中,提取应用于预测目标复合体对信息的预测规则,所述预测目标复合体对信息表示这样的预测目标蛋白复合体对,即,该预测目标蛋白复合体对中的受所述相互作用影响的亚单位对是未知的,或者该预测目标蛋白复合体对的相互作用是未知的,所述多个规则是从所述学习数据的集合中获得的。
2、根据权利要求1所述的方法,该方法还包括以下步骤:
检测步骤,其从所述学习数据中检测只具有所述亚单位属性信息的亚单位的数量和既具有所述亚单位属性信息又具有所述相互作用属性信息的亚单位的数量;和
可信度计算步骤,其基于在所述检测步骤处的检测结果来计算所述规则的可信度,其中
所述预测规则提取步骤包括基于所述可信度提取所述预测规则的步骤。
3、根据权利要求2所述的方法,该方法还包括支持度计算步骤,该支持度计算步骤基于所述检测步骤的结果和所述亚单位的总数来计算所述规则的支持度,其中
所述预测规则提取步骤包括基于所述支持度提取所述预测规则的步骤。
4、根据权利要求2所述的方法,该方法还包括优势对数得分计算步骤,该优势对数得分计算步骤基于所述检测步骤的结果计算所述预测规则的优势对数得分。
5、根据权利要求2所述的方法,该方法还包括以下步骤:
预测目标数据获取步骤,其获取作为所述预测目标复合体对信息的学习数据的预测目标数据;
判断步骤,其判断在所述预测目标数据中是否存在与所述预测规则相一致的规则;
标识步骤,其基于在所述判断步骤处的判断结果,使用所述预测规则标识出受相互作用影响的负责亚单位对和相互作用属性中的至少一个;以及
输出步骤,其输出在所述标识步骤处的标识结果,其中
对于其相互作用属性已知的预测目标蛋白复合体对,在所述标识步骤处标识出所述负责亚单位对,并且
对于其相互作用属性未知的预测目标蛋白复合体对,在所述标识步骤处标识出所述负责亚单位对和所述相互作用属性。
6、根据权利要求5所述的方法,其中
所述标识步骤包括以下步骤:基于在所述判断步骤中被判断为一致的预测规则的可信度,标识出所述负责亚单位对和所述相互作用属性中的至少一个。
7、根据权利要求6所述的方法,其中
所述标识步骤包括以下步骤:基于与从所述预测规则的最高优势对数得分起的次序成比例的系数,标识出所述负责亚单位对和所述相互作用属性中的至少一个。
8、根据权利要求1所述的方法,该方法还包括以下步骤:
复合体对信息获取步骤,其获取表示受相互作用影响的蛋白复合体对的复合体对信息;
排他家族标识步骤,其基于其中对表示蛋白质的性质的多个家族进行了分组的家族列表,从所述家族列表中的所述多个家族中,标识出作为表示每一个所述蛋白质的性质的代表性家族的排他家族;以及
分组步骤,其将形成所述复合体对信息中的蛋白复合体的蛋白质分组成每一个都包括具有公共排他家族的蛋白质的多个亚单位,以将所述复合体对信息转换成亚单位复合体对信息,其中
所述亚单位提取步骤包括从所述亚单位复合体对信息中提取所述亚单位的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610136696.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用