[发明专利]一种基于协同作用网络的生物组学数据分析方法有效
申请号: | 202010573023.7 | 申请日: | 2020-06-22 |
公开(公告)号: | CN111739582B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 林晓惠;白嵩楠;张艳慧 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉;刘秋彤 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 作用 网络 生物 数据 分析 方法 | ||
本发明提供一种基于协同作用网络的生物组学数据分析方法,属于生物组学数据分析技术领域。本发明针对基因组学、转录组学与代谢组学数据维数高、样本量小的特点,通过构建协同作用网络,来充分挖掘组学分子间的协同互补关系,基于模块搜索的方式来选定重要模块,从而确定潜在的模块标志物。本发明为基因组学、转录组学与代谢组学数据的前期分析处理提供了切实有效的方法,对后续的医疗诊断具有较强的应用价值。
技术领域
本发明属于生物组学数据分析技术领域,通过分析评价基因组学、转录组学或代谢组学数据特征间的协同作用,利用信息论的技术,从网络层面来挖掘组学数据重要特征,从而确定与疾病相关的模块标志物,对后续医学研究具有重要意义。
背景技术
随着人类基因组计划的完成,高通量测序技术的日臻完善,这极大的促进了基因组学、转录组学数据的发展,近些年来,代谢组学成为继基因组学、转录组学后新近发展起来的热门学科,成为生物组学数据重要组成部分之一。生物组学数据通常具有维数较高、样本量较小的特点。受实验条件、实验设备等限制,往往会导致数据所含噪音杂质较多,因此如何从生物组学大数据中挖掘出重要的信息,对疾病诊断、药物研发、个性化治疗等具有重要的意义。
目前大多数方法只停留在分子层面来筛选生物标志物,而生物系统是一个复杂的网络,代谢反应机制十分复杂,分子以各类通路反应的形式相互关联,相互作用,共同反映生命活动变化,因此基于网络方式来筛选模块标志物是尤为必要的。生物分子间往往会存在协同交互作用,两个区分能力较弱的分子联合所提供的交互信息可能与类别高度相关。协同作用网络通过计算信息增益得分,充分考虑分子与分子的关联关系,对具有协同交互作用的分子之间构建连边。本发明在综合分析基因组学、转录组学与代谢组学的基础上,提出了一种基于网络方式的模块标志物筛选技术即MSIG算法。该技术通过构建协同作用网络,综合考虑分子间的交互作用,在所构建的网络上搜索特征模块,从而来确定潜在的模块标志物。本发明基于协同作用网络来筛选具有重要生物意义的模块标志物,在生物学领域中有着广泛的实际应用价值。
发明内容
本发明的目的是在基因组学、转录组学、代谢组学大数据中提取具有生物学意义的模块标志物,对后续医疗诊断提供实际应用价值。本发明提出了一种基于协同作用网络确定模块标志物的数据分析方法。该方法的核心技术为:对于二分类问题,令F={f1,f2,…,fm}表示特征集合,对于集合内的每一对特征fi,fj∈F(1≤i≠j≤m),计算信息增益值IG,该指标可以衡量组学数据分子之间复杂的线性关系和非线性关系,只保留具有显著性IG的特征对来构建协同作用网络。在所构建的网络上采用贪心策略搜索模块标志物,取网络中与类标互信息值最大的节点作为初始种子节点,依次检索在网络中与当前模块所含节点相邻且不属于该模块的节点集作为候选节点集合,综合衡量每一候选点与当前模块协同作用的紧密程度以及自身所包含的与类标的互信息值的大小,将网络的拓扑结构与边的权值相结合评价每一个候选节点的重要程度,每次尝试将得分最高的节点加入到当前模块,并计算模块的整体分类性能是否较之前有所提高,若提高,则将其加入并继续检索当前模块的邻接节点集合,直到模块的性能不再增加或无邻接点为止,则该模块搜索结束并从网络中删除其所包含的节点及其连边。重复此搜索过程,直至网络中所剩节点数量为空。最后根据模块AUC值对所得模块降序排序,利用内部交叉验证的方式,选取准确率最高的若干模块,作为所选模块标志物。
为了实现上述目标,本发明采用的技术方案如下:
一种基于协同作用网络的生物组学数据分析方法,步骤如下:
将高通量测序技术所得的基因组学或转录组学数据中的基因序列视为特征,基因序列在不同样本上的表达值视为特征值;利用LC-MS或GC-MS技术得到代谢组学数据中的小分子代谢成分(相对分子量1000以下),将实验所得的小分子代谢成分视为特征,小分子代谢成分在不同样本上的含量视为特征值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010573023.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:监控方法、装置、设备及存储介质
- 下一篇:智能柜台业务信息审核方法及装置