[发明专利]用于生物路径中的调控互动的学习和识别的系统和方法有效
申请号: | 201380064123.5 | 申请日: | 2013-10-09 |
公开(公告)号: | CN104838372B | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | C·J·瓦斯克;A·J·塞奇威克;其他发明人请求不公开姓名 | 申请(专利权)人: | 凡弗3基因组有限公司 |
主分类号: | G06F15/18 | 分类号: | G06F15/18 |
代理公司: | 余姚德盛专利代理事务所(普通合伙) 33239 | 代理人: | 郑洪成 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生物 路径 中的 调控 互动 学习 识别 系统 方法 | ||
所提出的系统和方法用于利用对概率图模型生物路径中的调控互动进行机器学习和识别,而且尤其用于调控参数中的互动关联的识别。
相关申请的交叉引用
本申请请求共同待决的2012年10月9日提交的序列号为61/711491的美国临时专利申请、2012的年11月26日提交的序列号为61/729958的美国临时专利申请、以及2013的年1月18日提交的序列号为61/754175的美国临时专利申请的优先权。
技术领域
本发明的领域是组学数据的计算分析,具体地本发明涉及针对路径分析的学习算法以及用途。
背景技术
随着高速的遗传病筛查的出现,已经获得了捕获细胞的分子状态的逐步更大的数据集,而且这些进步实现了对癌症中改变的细胞机理的增强的识别和理解。例如,对特定肿瘤内频繁变化的关键目标的识别导致了最近 20年来多达40种射靶疗法的开发。可惜的是,在大部分情况下,这些药物中的许多的反应速率低于50%,突出了这些药物所影响的路径的不完全理解。抗性机制的典型示例是结肠癌肿瘤中变化的EGFR中的RAS路径的激活,其中突变的KRAS构成地激活RAS串,提供与EGFR路径独立的生长信号,导致诸如西妥昔单抗治疗之类的EGFR封闭疗法极大地无效。因此,看起来,西妥昔单抗对路径的干扰的知识相对于致瘤信号在细胞信令网络行进所经由的关键途径是不完整的。
由于用于在路径水平下对组学数据进行积分的大量计算工具现在变得可用,所以这种明显的不完整知识将更使人烦恼的。在各种其它工具中,多种算法(例如,GSEA、SPIA和通路Ologist)能够利用从文献编组的路径成功地识别出感兴趣的变化的路径。其它一些工具已经从文献中的编组互动创建了因果图,而且已经使用这些图来解释表达谱。诸如ARACNE、MINDy 和CONEXIC之类的算法采用了基因转录信息(以及拷贝数,在CONEXIC的情况下),由此很可能在一组癌症样本上识别出转录驱动器。然而,这些工具不会将不同驱动器组成识别单个关注目标的功能网络。诸如NetBox和 Mutual Exclusivity Modules inCancer(MEMo)之类的一些更新的路径算法试图解决癌症中的数据积分的问题,从而识别对样本的致瘤潜能关键的多种数据类型的网络。虽然这种工具允许路径上的至少一些有限积分以便找到网络,它们一般不能提供调控信息、以及该信息与相关路径或路径的网络中的一个或多个效应的关联。类似地,GIENA寻找单个生物路径中的解除管制的基金互动,但是不考虑路径的拓扑或者关于互动的方向或本质的先验知识。
外部遗传分析、概率图模型已经被广泛地用在网络分析中,其中具有贝叶斯网络和马尔可夫随机场形式的界标使用。多种方法已经通过多种不同方式从数据中成功地学习了互动,包括相关网络。更近时间以来, PARADIGM(在染色体组模型使用数据积分的路径识别算法)是在 WO2011/139345和WO/2013/062505中描述了的一种染色体组分析工具,其使用概率图模型来在编组路径数据库上整合多种染色体组数据类型。这种模型系统有利地使得各个样本能够被单独访问或者在成群关注的环境下被访问。然而,在该工具中学习的期望最大化(EM)参数仅仅缺省地在观察的数据参数上执行,因为有限尺寸的可用数据集抑制了互动参数的稳健评估。所以,该工具不能实现对将影响特定路径段中的活动的多种因素的互动和相互关系的分析,而且由此不能提供对流经细胞信令网络的信号流的改进的分辨率。
因此,即使学习和识别生物路径中的调控互动的大量系统和方法在本领域是已知的,所有或者几乎所有这些系统和方法具有一种或多种缺点。例如,在此以前已知的解析工具不能识别出调制路径的通路中的活动的参数的互动的强度和方向,由此不仅不能实现信号流和/或路径活动的干扰的预测,而且不能识别参数或路径元素的潜在差分使用。从不同观点来看,当前已知的工具通常仅仅考虑单独的基因活动,但是不能检查与调控链接相关的统计结果,因此仅仅提供了静态模型而不是动态模型。由此,已知的模型还不能检查网络中不同的调节器如何产生类似的细胞表型,尽管采用了完全不同的路径来实现它们。因此,仍然需要改进的系统和方法来学习和识别生物路径中的调控互动。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于凡弗3基因组有限公司,未经凡弗3基因组有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380064123.5/2.html,转载请声明来源钻瓜专利网。