[发明专利]一种基于动态网络图分析的时间序列数据处理方法在审
申请号: | 201510779302.8 | 申请日: | 2015-11-13 |
公开(公告)号: | CN105447337A | 公开(公告)日: | 2016-03-30 |
发明(设计)人: | 林晓惠;黄鑫;曾珺;尹沛源 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F19/12 | 分类号: | G06F19/12 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 网络图 分析 时间 序列 数据处理 方法 | ||
技术领域
本发明属于生物数据分析技术领域,是一种利用动态网络分析对代谢组学时间序列数据进行处理,以确定复杂疾病(如肝癌)发生的前瞻性潜在生物标志物的新方法。
背景技术
肝癌是常见的恶性肿瘤之一,死亡率高居恶性肿瘤的第二位,全世界平均每年大约有600,000人死于肝癌。肝癌通常起源于慢性肝病,且大部分与肝硬化相关。由于肝癌的发生涉及众多因素的复杂相互作用(如遗传、病毒及环境等),因此致病机理尚不明确。肝癌的预后较差,常常确诊时病人已处于癌症的晚期。目前,常规的肝癌诊断技术有超声、影像学和甲胎蛋白(AFP)等。然而,确诊时可做根治性治疗的肝癌患者仅有30%。常用的生物标志物AFP其灵敏度有限,特异性也较低。而且肿瘤进展相对较快,存在早期诊断困难,治愈率低等难题。手术切除和肝移植是当前根治性治疗肝癌最常用的办法。然而,肝癌病人术后复发及转移相当常见,术后五年生存率为30%-40%。因此,深入研究肝癌发生发展所涉及的致病机理,发现肝癌的前瞻性标志物,以便通过早期诊断改善患者预后效果,提升术后五年生存率。
作为生物化学反应中的中间体和终端产物,代谢物在连接生命体系的不同生物途径及保持正常生理功能中起到了重要作用。代谢组学是对生命机体由生理、病理刺激和基因修饰等产生的代谢物的质和量的动态变化的研究。作为系统生物学的重要组成部分,代谢组学在诸多领域(疾病研究,药物研究,植物研究等)得到了广泛应用。随着分离分析技术的快速发展,代谢数据具有海量、多维、结构复杂等特点。如何从中挖掘出反映研究问题本质的关键代谢成分,寻找区分不同生物样本的差异性潜在标志物已成为代谢组学研究的问题之一。
代谢本身是一个动态过程,从动态的角度研究代谢组,通过代谢物随疾病发生、发展的动态变化的分析对复杂疾病进行深入分析,有利于疾病致病机理、早期诊断和个性化治疗的研究。同时,在复杂的生命过程中,代谢成分之间相互关联、相互作用,以反映生物体的生理、病理变化。在受到外界刺激或环境变化时,不同代谢物之间的相互关联性也会发生改变。因此分析生命过程中代谢成分之间的相互关联、构建代谢网络、研究代谢网络的动态变化可以更全面地揭示疾病的发生、发展过程,从而更利于疾病诊断、治疗等方面的研究。代谢组学时间序列数据常常表现出样本数少,变量数多以及时间点稀疏等特性,许多经典的时间序列算法并不适合于代谢组学时间序列数据的研究。
本发明从代谢网络动态变化的角度分析代谢组学时间序列数据,发现复杂疾病的预警信息。引入非重叠区域比率(NOR)来衡量代谢物之间的比值在疾病发展过程中的动态变化,根据比值在前后时间点上的变化构建动态网络。代谢物的比值可以反应将其中一种代谢物通过一条或多条代谢通路转变为另一种代谢物的过程。
发明内容
本发明提供一种基于动态网络图分析的时间序列数据处理方法,是基于变量比值的NOR随时间的变化构建动态代谢网络,能够更切实有效的反映生命机体生理和病理的变化。同时,使用动态浓度分析和拓扑结构分析两种分析方法寻找疾病发生的前瞻性潜在生物标志物。
本发明采用的技术方案如下:
一、静态分析
噪音或无关变量常常影响代谢组学数据分析的效果,若代谢组学时间序列数据中疾病经历了Ns种不同的状态,那么在病程中任意两个不同阶段无区分能力或区分能力弱的代谢变量通常为噪音或与所研究问题无关的特征,应当被删除。本发明根据时间序列数据中的Ns种不同的状态建立Ns(Ns-1)/2个两类子问题,从每一个子问题中确定具有一定区分能力的特征用来构建代谢网络。
本发明利用代谢变量之间比值的有效范围的变化来分析代谢物之间关系的变化。令F={f1,f2,…,fm}为特征集合,其中m表示变量的个数。fit(1≤i≤m,1≤t≤N)为变量fi在第t个时间点上的含量,N为时间点的数量。特征fi,fj的比值变量rij在时间点t上的有效范围定义为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510779302.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通用SD资料卡制作方法
- 下一篇:可远程监控的腹膜透析系统及监控方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用