[发明专利]一种基于动态网络图分析的时间序列数据处理方法在审
申请号: | 201510779302.8 | 申请日: | 2015-11-13 |
公开(公告)号: | CN105447337A | 公开(公告)日: | 2016-03-30 |
发明(设计)人: | 林晓惠;黄鑫;曾珺;尹沛源 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F19/12 | 分类号: | G06F19/12 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 网络图 分析 时间 序列 数据处理 方法 | ||
1.一种基于动态网络算法对时间序列数据进行分析,其特征在于以下步骤:
步骤1:静态分析
根据时间序列数据中的Ns种不同的状态建立Ns(Ns-1)/2个两类子问题,从每一个子问题中确定具有一定区分能力的特征用来构建代谢网络;利用代谢变量之间比值的有效范围的变化来分析代谢物之间关系的变化;令F={f1,f2,…,fm}为特征集合,其中m表示变量的个数;fit(1≤i≤m,1≤t≤N)为变量fi在第t个时间点上的含量,N为时间点的数量;特征fi,fj的比值变量rij在时间点t上的有效范围定义为:
公式(1)中分别表示比值变量rijt的有效范围的上、下界;γ取值为1.732,以保证rijt的有效范围至少含有2/3的样本;μijt和σijt分别表示比值变量rijt的均值和标准差;比值变量rijt在相邻两个时间点上有效范围的变化存在三种情况:
(1)rijt在相邻两个时间点上的有效范围存在部分重叠;
(2)rijt在一个时间点上的有效范围完全包含于其在另一个时间点的有效范围内;
(3)rijt在相邻两个时间点上的有效范围不存在重叠部分;
情况(2)没有明确反映出代谢通路反应的变化趋势,所以本发明仅考虑其它两种情况并使用如下公式计算比值变量在相邻时间点上的NOR:
NOR(rijt)=(Lt1-Lt2)/max{Lt1,Lt2}(2)
公式(2)中
步骤2:网络构建
(1)输入静态分析后所得到的特征子集;
(2)对输入的特征子集中的任意两个变量fi,fj在每个时间点上构建比值变量rijt;
(3)根据公式(1)计算每个比值变量rijt的有效范围E(rijt);
(4)根据比值变量rijt的有效范围E(rijt),使用公式(2)计算该比值变量在相邻两个时间点上的NOR值;
(5)如果rijt的NOR值大于等于τ,则该相邻两时间点所对应网络图中两个变量fi,fj以红边相连;反之,NOR值小于等于-τ,则网络图中两个变量fi,fj以绿边相连;
(6)输出在两个相邻时间点上建立的网络图DN-i(1≤i≤N-1);
步骤3:网络分析
(1)动态浓度分析
动态浓度分析研究疾病发展过程中代谢物之间的比值的变化趋势;探索复杂疾病恶化前的某些连续时间点;如果比值变量的有效范围在连续Ne个时间点上沿着同一个方向变化,则表明随着疾病的发展代谢活动是持续紊乱的;为寻找疾病发生的预警信息,本发明分析网络图DN-i(s-Ne≤i<s-1)并将颜色相同的边提取出来,这些沿着同一个方向持续变化的比值预示着疾病的恶化,即是所确定的疾病恶化的预警信息;
(2)拓扑结构分析
N个时间点产生N‐1个网络图;如果网络DN-t(1≤t<N)的边数较多,则表示有大量的化学反应其反应速率加快,机体处于相对剧烈的生命活动阶段;具有边数最多的网络DN-t表明病程发展到了关键时期,其所对应的时间点表示为复杂疾病的早期阶段;在拓扑结构分析中,本发明关注于具有边数最多的网络图并且着重分析度数最大的k≥1个节点;这些节点及其与之相连的节点作为复杂疾病早期诊断的潜在性标志物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510779302.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通用SD资料卡制作方法
- 下一篇:可远程监控的腹膜透析系统及监控方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用