[发明专利]一种启发式代谢共表达网络的构建方法及系统有效
申请号: | 201610050607.X | 申请日: | 2016-01-25 |
公开(公告)号: | CN105718999B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 纪震;周家锐;殷夫;朱泽轩 | 申请(专利权)人: | 深圳大学;纪震;周家锐;殷夫;朱泽轩 |
主分类号: | G06N3/00 | 分类号: | G06N3/00 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 共表达 启发式 代谢 构建 最优特征子集 适应度函数 多模优化 概率模型 网络结构 网络 代谢物 互信息 算法 寻优 搜索 智能 优化 学习 | ||
本发明公开一种启发式代谢共表达网络的构建方法及系统。本发明根据最大依赖准则将多个代谢物特征的互信息作为适应度函数值,并使用启发式计算智能多模优化算法对最优特征子集进行寻优搜索。通过多次运行这一优化过程,将各次结果进行组合学习,构造共表达网络结构。最后,通过概率模型计算切分阈值,获得准确、稳定的代谢共表达网络。
技术领域
本发明涉及代谢组学网络领域,尤其涉及一种启发式代谢共表达网络的构建方法及系统。
背景技术
代谢物是生物体内完成代谢过程的小分子有机化合物总称,包含了丰富的生理状态信息。代谢组学基于对代谢物的整体系统性研究,可有效揭示生理现象背后的真实机理,并更为全面地展示生命体的动态状态。因此获得了越来越多的重视,被广泛应用于诸多科研与实用领域中。而另一方面,传统机器学习方法往往难以应对代谢组学特征高维度、小样本、高噪声的数据特点。使用创新的网络结构描述代谢物间的相互关联,并以此进行准确、稳定的分析,是代谢组学未来发展的重要方向。
已有的代谢组学网络描述方法主要包括两类:
其一是全基因代谢网络重构方法。其以基因表达信息为基础,通过获取其可能产生的蛋白质列表,搜索EC(Enzyme Commission Number)数据库得到对应的蛋白酶,并根据代谢途径(Pathway)数据库取得所有可能的化学反应,使用连接算法组合为包含高假阳性的代谢网络草图。而后根据在特定条件下的实验表达信息,对草图进行修正与剪裁,最终获得较为准确的网络结构。
其二是代谢网络的共表达构建方法(Metabolic Co-expression Network)。直接评估不同代谢物特征在各实验条件下的表达差异,通过计算相关性参数(CorrelationCoefficient)形成权值矩阵。而后人为设定或使用适应性算法确定切分阈值,对矩阵进行简化,最终映射为网络结构。
一般认为,代谢共表达网络可更为有效地描述未知的生理关联信息,且对先验知识要求较低,更适合于非针对性代谢组学研究,是发掘与分析代谢组学新知识的有力工具。但在生物数据中,其相关性参数的计算往往有着较大误差,且人为设定的切分阈值缺乏理论依据,导致最终结果难以令人满意。针对这一问题,近年来提出了基于特征选择的共表达网络构建方法,获得了学术界的广泛重视。
现有的全基因代谢网络重构方法,其缺点在于:
第一,其包含了现有数据库中所有可能的代谢反应,具有极高的假阳性。尽管实验数据可部分消除此类网络连接,但若要对其进行准确修正,所需的样本量过高,成本较高。
第二,其严重依赖于现有的基因表达、酶催化及代谢途径等先验知识。而此类知识,特别是代谢组学相关的数据库仍有着大量信息缺失。导致所构建的网络具有高假阴性。此外,其网络完全基于现有知识,难以用于新生物信息的发掘。
现有的代谢共表达网络构建方法,其缺点在于:
第一,基于相关性参数的方法,如Pearson相关系数、Spearman相关系数等,其参数计算所需样本量较高,在生物实验中往往难以满足。导致所估计的相关程度有所偏差,构造网络的鲁棒性不佳。且人为设定切分阈值并无理论支撑,容易再次引入误差,影响分析结果。
第二,现有算法仅能估计两两特征(Pairwise Features)间的关联信息。而在真实生命体中,多个代谢物往往会相互连接形成功能模块,整体对生理过程进行调控。现有方法并不能有效描述这一特点。
第三,现有基于特征选择的网络构建方法一般使用确定性搜索方法,对于相同数据集仅能获得唯一的特征子集。而对于高维代谢组学数据,此类解往往不是最优的。此类方法也无法通过多次运行程序搜索更佳的结果。
因此,现有技术还有待于改进和发展。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学;纪震;周家锐;殷夫;朱泽轩,未经深圳大学;纪震;周家锐;殷夫;朱泽轩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610050607.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于流特征的因果结构学习方法
- 下一篇:一种生成二维码图片的方法