[发明专利]一种特定癌症差异表达基因调控网络的构建方法有效
申请号: | 201610128387.8 | 申请日: | 2016-03-07 |
公开(公告)号: | CN105740651B | 公开(公告)日: | 2018-05-22 |
发明(设计)人: | 刘桂霞;苏令涛;孟祥宇;马青山 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F19/20 | 分类号: | G06F19/20 |
代理公司: | 北京远大卓悦知识产权代理事务所(普通合伙) 11369 | 代理人: | 史霞 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特定 癌症 差异 表达 基因 调控 网络 构建 方法 | ||
本发明公开了一种特定癌症差异表达基因调控网络的构建方法,包括如下步骤:步骤一、根据基因间的功能相似性权值,构建骨架基因互作网络;步骤二、采用分割法,对骨架基因互作网络进行模块划分;步骤三、使用全基因甲基化数据筛选差异表达基因;步骤四、将筛选出来的差异表达基因按照功能进行归类;步骤五、将所有映射到相同功能模块的差异表达基因作为一个功能分类;步骤六、在对每一个功能分类中的所有基因构建调控网络;步骤七、在骨架网络的指导下进行子网络拼装。本发明大大降低了计算的复杂度并且有较高的精度。
技术领域
本发明涉及基因调控网络技术领域,特别涉及一种特定癌症差异表达基因调控网络的构建方法。
背景技术
构建特定癌症差异表达基因调控网络对于识别该种癌症的致病基因,药物靶标的筛选具有重要意义。在基因调控网络构建方面当前方法主要分为四大类:1,基于相似性度量的方法;2,基于图结构搜索的方法;3,基于概率推理的方法;4,基于方程求解的方法。在基于相似性度量的方法中,典型的相似性度量策略包括:皮尔森相关系数、互信息,距离相关等。如Margolin等提出的ARACNE算法就是基于互信息的方法来构建调控网络,这种方法利用离散化的基因表达数据计算基因间的相似性值,而在现实的生物系统中,基因的表达过程是连续的,因此,在对基因数据进行离散化时不可避免的会造成很多重要的表达信息的丢失。并且该方法适合于小规模数据分析,在数据量比较大的情况下扩展性很差。基于图结构搜索的算法包括:基于搜索评分的结构学习算法,基于布尔网络的建模方法,基于BDe评分函数的K2算法等,其中Cooper提出的K2算法首先在给定先验信息和节点顺序的情况下,通过后验概率作为评分标准并利用贪婪搜索方法找出最佳网络结构。但是这类方法不适合处理高维数据,计算复杂度高。贝叶斯网络是典型的基于概率推理的调控网络构建模型,它主要利用局部概率的乘积来近似描述整体网络结构复杂的概率分布。它是变量之间概率依赖关系的一种图形表示方式,节点之间存在边表示节点间存在概率依赖关系,且依赖的程度是一个概率参数。然而这类方法不能很好的重构基因间的调控关系,因为基因之间的复杂调控关系很难通过概率计算得到,因此通过这类方法构建的调控网络精度较低,算法鲁棒性差且计算复杂度高。基于方程求解的建模算法主要包括:线性方程方法、回归方程方法、基于状态空间方程的方法、基于自回归方程求解的方法。在基于方程的调控网络构建中微分方程法通过加入新的变量,微分方程模型可以进一步描述环境变化对于基因表达水平的影响。微分方程的缺点则是难以适应中大型网络的构建,中大型网络结构估计的精度较低。综上所述,尽管当前构建基因调控网络的方法多种多样但是归结起来他们都有如下缺陷:1、采用基因表达谱数据作为寻找基因间复杂调控关系的单一数据来源。然而,基因表达数据其实是一个点数据,是所有基因在某个特定时间点下的表达情况的一个定量描述,很难仅仅使用基因表达数据分析捕获基因间调控关系。2、普遍适用于小范围数据分析,计算复杂度较高,不适用于全基因组基因调控网络构建。3、精度值较低,当前方法普遍采用从基因表达数据逆向推理基因调控网络的方法,这种方法具有随机性,很难精确的寻找真正的调控作用关系。此外在寻找差异表达基因时通常采用对比患病样本和正常样本的基因表达水平的差异的方法,然而基因表达数据是基因调控作用的结果,没有从基因调控的源头进行分析。
发明内容
本发明设计开发了一种特定癌症差异表达基因调控网络的构建方法,克服了现有方法中计算复杂度高、数据来源单一、不适合全基因组调控网络构建的缺陷,大大降低了计算的复杂度并且有较高的精度。
本发明提供的技术方案为:
一种特定癌症差异表达基因调控网络的构建方法,包括如下步骤:
步骤一、根据基因间的功能相似性权值,构建骨架基因互作网络;
步骤二、采用分割法,对骨架基因互作网络进行模块划分;
步骤三、使用全基因甲基化数据筛选差异表达基因;
步骤四、将筛选出来的差异表达基因按照功能进行归类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610128387.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用