[发明专利]一种利用网络结构信息识别显著生物通路的方法无效
申请号: | 201310028142.4 | 申请日: | 2013-01-24 |
公开(公告)号: | CN103093119A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 顾祖光;范垚;李捷;王进 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210093 江苏省南京市鼓楼区汉*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 网络 结构 信息 识别 显著 生物 通路 方法 | ||
技术领域
本发明涉及高通量生物芯片基因表达检测方法,特别涉及基因表达谱芯片检测中利用网络结构信息识别被显著影响的生物通路的方法。
背景技术
高通量技术和组学技术的发展,使得人们可以在系统水平上对生物体内部的分子过程进行检测,从而有助于了解基因及其它生物分子所参与的复杂的相互作用。基因芯片技术被广泛应用于测量基因组水平的基因表达值,从而产生出海量的生物数据,对这些数据的生物意义解读是当前基因芯片技术的一个难点。由于生物系统主要是通过基因与基因之间的相互作用而实现功能,因此,与传统的单基因分析方法不同,基因芯片数据处理的新挑战是如何找出被一组相关基因所影响的生物过程。特定生物过程常用其生物通路来表述,即指一组基因和小分子以化学反应、分子修饰或者信号传导的方式来实现特定生物功能的分子网络。由于生物通路通过基本的基因网络回路来实现特定的生物功能,那么对生物通路的干扰必定导致正常生物系统的紊乱。因此,在特定的生物条件下去寻找显著变化的生物通路能够有助于研究人员把注意力集中到对生物系统最为重要的一组基因上去。但是由于目前寻找显著的生物通路的方法把所有基因视为等同地位,因此在具体应用中还无法达到满意的效果。生物中通路包含着最重要的信息,即,其中的成员基因是如何与其他基因进行相互作用的。很明显对生物通路中关键基因的干扰要比对非关键基因的干扰对整个生物通路的影响更大。生物通路的形式是一个网络或者图,其中包含了节点和边,因此,网络的结构信息对于衡量生物通路的显著性是至关重要的。目前的方法并没有考虑到生物通路的结构信息,因此在实际的应用中对于揭示由于关键基因和关键调控路径所影响的生物通路还存在着很大的不足,无法找到真正起关键作用的生物通路。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术识别显著生物通路方法的不足,提出一种更加有效的利用网络结构信息的识别显著生物通路的方法,这种方法找到的生物通路能够揭示出其中重要的关键基因和调控路径。
技术方案:本发明公开了一种利用网络结构信息识别显著生物通路的方法,包括以下步骤:
步骤1,输入基因芯片数据,选择基因ID类型;
步骤2,整理和使用公共的生物通路数据集,将基因芯片所含基因归属到所属已知的生物通路中;
步骤3,使用生物通路的网络结构信息和基因芯片的表达信息计算每条生物通路的差异性总得分;
步骤4,构建随机对照数据,计算每条生物通路的显著性,即p值;
步骤5,对计算出的p值进行多假设检验的FDR控制,即对原始p值进行校正;
步骤6,根据设定的修正后的p值的阈值,判断每条生物通路的显著性是否符合阈值要求,如果判断结果为否,则抛弃;如果判断结果为是,则输出识别结果。
本发明中,步骤1中,输入的基因芯片数据一般为矩阵格式,其中行对应着基因,列对应着不同的实验样本。基因统一使用Symbol来表示。
本发明中,步骤2中,使用公共的生物通路数据集,对其中的每一条生物通路,判断基因芯片中的基因是否属于此生物通路。
本发明中,步骤3中使用生物通路的网络结构信息和基因芯片表达信息计算每条生物通路的差异性具体包括以下步骤:步骤11将生物通路中的基因映射为网络节点;步骤12计算网络中心性指标;步骤13使用基因芯片数据判断网络节点被差异表达影响的程度;步骤14计算生物通路整体差异性的总得分;
步骤11中,对生物通路中的每个节点判断其是否包含基因以及所包含基因的数目。
步骤12中所述的网络中心性指标一共有三种:
a)度:与网络中某个节点直接相连的节点个数,衡量一个基因调控其他基因的个数,按照网络边的方向,度分为入度和出度;
b)最短路径中间性:衡量经过一个节点的信息流数量,在网络结构中,衡量起枢纽作用的关键基因,定义为,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310028142.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置