[发明专利]一种基于动态网络图分析的时间序列数据处理方法在审

专利信息
申请号: 201510779302.8 申请日: 2015-11-13
公开(公告)号: CN105447337A 公开(公告)日: 2016-03-30
发明(设计)人: 林晓惠;黄鑫;曾珺;尹沛源 申请(专利权)人: 大连理工大学
主分类号: G06F19/12 分类号: G06F19/12
代理公司: 大连理工大学专利中心 21200 代理人: 梅洪玉
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种基于动态网络图分析的时间序列数据处理方法,从网络的角度分析代谢组学队列数据,分析变量之间的相互联系,根据变量之间关联性的动态变化构建代谢网络,并通过动态浓度变化和网络拓扑结构的变化分析确定疾病(例如恶性肿瘤)发生的预警信息。弥补了采用静态分析方法处理代谢组学时间序列数据忽略特征动态变化信息的缺点。而且,相对致力于发现单分子标志物的算法,本发明考察变量间的相互关系随时间的变化情况,分析、确定疾病发生改变的关键节点,从而更有助于对疾病致病机理的研究,为疾病的早期诊断和预后研究奠定基础。
搜索关键词: 一种 基于 动态 网络图 分析 时间 序列 数据处理 方法
【主权项】:
一种基于动态网络算法对时间序列数据进行分析,其特征在于以下步骤:步骤1:静态分析根据时间序列数据中的Ns种不同的状态建立Ns(Ns‑1)/2个两类子问题,从每一个子问题中确定具有一定区分能力的特征用来构建代谢网络;利用代谢变量之间比值的有效范围的变化来分析代谢物之间关系的变化;令F={f1,f2,…,fm}为特征集合,其中m表示变量的个数;fit(1≤i≤m,1≤t≤N)为变量fi在第t个时间点上的含量,N为时间点的数量;特征fi,fj的比值变量rij在时间点t上的有效范围定义为:<mrow><mi>E</mi><mrow><mo>(</mo><msub><mi>r</mi><mrow><mi>i</mi><mi>j</mi><mi>t</mi></mrow></msub><mo>)</mo></mrow><mo>=</mo><mrow><mo>&lsqb;</mo><mrow><msubsup><mi>er</mi><mrow><mi>i</mi><mi>j</mi><mi>t</mi></mrow><mo>-</mo></msubsup><mo>,</mo><msubsup><mi>er</mi><mrow><mi>i</mi><mi>j</mi><mi>t</mi></mrow><mo>+</mo></msubsup></mrow><mo>&rsqb;</mo></mrow><mo>=</mo><mrow><mo>&lsqb;</mo><mrow><msub><mi>u</mi><mrow><mi>i</mi><mi>j</mi><mi>t</mi></mrow></msub><mo>-</mo><mn>0.5</mn><msub><mi>&gamma;&sigma;</mi><mrow><mi>i</mi><mi>j</mi><mi>t</mi></mrow></msub><mo>,</mo><msub><mi>u</mi><mrow><mi>i</mi><mi>j</mi><mi>t</mi></mrow></msub><mo>+</mo><mn>0.5</mn><msub><mi>&gamma;&sigma;</mi><mrow><mi>i</mi><mi>j</mi><mi>t</mi></mrow></msub></mrow><mo>&rsqb;</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>公式(1)中分别表示比值变量rijt的有效范围的上、下界;γ取值为1.732,以保证rijt的有效范围至少含有2/3的样本;μijt和σijt分别表示比值变量rijt的均值和标准差;比值变量rijt在相邻两个时间点上有效范围的变化存在三种情况:(1)rijt在相邻两个时间点上的有效范围存在部分重叠;(2)rijt在一个时间点上的有效范围完全包含于其在另一个时间点的有效范围内;(3)rijt在相邻两个时间点上的有效范围不存在重叠部分;情况(2)没有明确反映出代谢通路反应的变化趋势,所以本发明仅考虑其它两种情况并使用如下公式计算比值变量在相邻时间点上的NOR:NOR(rijt)=(Lt1‑Lt2)/max{Lt1,Lt2}           (2)公式(2)中<mrow><msub><mi>L</mi><mrow><mi>t</mi><mn>1</mn></mrow></msub><mo>=</mo><msubsup><mi>er</mi><mrow><mi>i</mi><mi>j</mi><mrow><mo>(</mo><mi>t</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></mrow><mo>+</mo></msubsup><mo>-</mo><msubsup><mi>er</mi><mrow><mi>i</mi><mi>j</mi><mi>t</mi></mrow><mo>-</mo></msubsup><mo>,</mo><msub><mi>L</mi><mrow><mi>t</mi><mn>2</mn></mrow></msub><mo>=</mo><msubsup><mi>er</mi><mrow><mi>i</mi><mi>j</mi><mi>t</mi></mrow><mo>+</mo></msubsup><mo>-</mo><msubsup><mi>er</mi><mrow><mi>i</mi><mi>j</mi><mrow><mo>(</mo><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow><mo>)</mo></mrow></mrow><mo>-</mo></msubsup><mo>;</mo></mrow>|NOR(rijt)|越大,表示该比值在相邻时间点的变化越大;步骤2:网络构建(1)输入静态分析后所得到的特征子集;(2)对输入的特征子集中的任意两个变量fi,fj在每个时间点上构建比值变量rijt;(3)根据公式(1)计算每个比值变量rijt的有效范围E(rijt);(4)根据比值变量rijt的有效范围E(rijt),使用公式(2)计算该比值变量在相邻两个时间点上的NOR值;(5)如果rijt的NOR值大于等于τ,则该相邻两时间点所对应网络图中两个变量fi,fj以红边相连;反之,NOR值小于等于‑τ,则网络图中两个变量fi,fj以绿边相连;(6)输出在两个相邻时间点上建立的网络图DN‑i(1≤i≤N‑1);步骤3:网络分析(1)动态浓度分析动态浓度分析研究疾病发展过程中代谢物之间的比值的变化趋势;探索复杂疾病恶化前的某些连续时间点;如果比值变量的有效范围在连续Ne个时间点上沿着同一个方向变化,则表明随着疾病的发展代谢活动是持续紊乱的;为寻找疾病发生的预警信息,本发明分析网络图DN‑i(s‑Ne≤i<s‑1)并将颜色相同的边提取出来,这些沿着同一个方向持续变化的比值预示着疾病的恶化,即是所确定的疾病恶化的预警信息;(2)拓扑结构分析N个时间点产生N‐1个网络图;如果网络DN‑t(1≤t<N)的边数较多,则表示有大量的化学反应其反应速率加快,机体处于相对剧烈的生命活动阶段;具有边数最多的网络DN‑t表明病程发展到了关键时期,其所对应的时间点表示为复杂疾病的早期阶段;在拓扑结构分析中,本发明关注于具有边数最多的网络图并且着重分析度数最大的k≥1个节点;这些节点及其与之相连的节点作为复杂疾病早期诊断的潜在性标志物。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510779302.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top