[发明专利]基于流特征的因果结构学习方法有效
申请号: | 201610032838.8 | 申请日: | 2016-01-18 |
公开(公告)号: | CN105719006B | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 杨静;安宁;郭晓雪;丁会通;李廉 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06N5/00 | 分类号: | G06N5/00 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 因果 结构 学习方法 | ||
本发明公开了一种基于流特征的因果结构学习方法,其特征是按如下步骤进行:1、以流的方式产生分布任意的新特征;2、对每个新产生的特征,进行相关性分析;3、对特征集进行冗余校验分析;4、基于每个特征进行搜索定向。重复1,2,3,4步骤,直至产生的特征数超过极限值,最终可以获得对应的因果结构。本发明能够从具有流特征的线性任意分布的数据中发现蕴含的因果结构关系,同时降低学习的时间复杂度,从而满足在线学习的时效性要求。
技术领域
本发明属于数据挖掘领域,具体地说是面向线性任意分布数据的基于流特征的因果结构学习方法。
背景技术
随着社会进步和科技发展,人们需要认识的事物变得越来越复杂,系统内部的因果关系是客观存在的,因果结构学习就是从数据中挖掘蕴含的因果结构关系,可以帮助人们认清复杂事物的本质与规律。因果结构学习渗入到生物、医学、经济、自动控制、信息处理等各个学科,涉及到日常生活、工业生产、军事国防等各个方面。
现实生活中很多变量的分布往往是非高斯的。例如:脑磁图(MEG,magnetoencephalographic)源的值并不一定符合标准的高斯分布,不同的脑磁图源间的因果关系使用非高斯的因果模型分析更为适合;铜陵矿区土壤元素样品数据有些不符合高斯分布;股票指数并不一定符合高斯分布,使用非高斯的因果模型更能揭示不同区域股票指数间的因果关系;在证券投资中,投资收益率的分布也很多情况下是符合非高斯分布的;社会学中,研究变量的分布也并非一定符合高斯分布等等。
在很多情况下,数据还具有高维或流的特征。在图像处理领域,图像的特征维数非常高从而无法一次载入内存;在火星的弹坑(Crater)检测中,纹理特征也是非常庞大并且以流的方式顺序产生;在统计关系学习领域,一个SQL查询可能导致产生上百万的特征,并且这些特征以流的方式顺序产生;在生物学领域,基因表达数据也具有高维特性等等。并且,这些数据往往也是非线性非高斯的。
国内外的学者也提出了一系列的因果结构学习算法,典型的贝叶斯网络结构学习方法包括基于搜索打分(Search-And-Score)的方法、基于依赖分析(Constrained Based)的方法和两者混合的方法,如SGS算法、PC算法、TPDA算法、K2算法]、OR算法、SC算法]、MMHC算法等等。然而,大多数的结构学习算法是基于离散数据进行研究的,不能有效地处理连续数据。近年来,对连续数据进行因果发现研究已成为一个新的研究热点,也涌现了很多方法。如L1MB算法,TC算法,ICA-LiNGAM算法,PClingam算法,HP算法,Two-Phase算法,DirectLiNGAM算法,PCB算法等。
目前经典的因果结构学习方法都不能有效的处理具有流特征的线性任意分布的连续数据,这些方法的主要局限包括:
(1)面向线性任意分布的结构学习算法多数属于基于依赖分析的方法,该方法为了判断两特征间是否相关,需要在大量的子集上进行独立性测试,导致需要较多的独立性测试,从而需要耗费很多的时间,计算复杂度比较大;
(2)面向线性任意分布的结构学习算法一般假设可以事先获得所有的数据,不能处理具有流特征的数据,即特征逐个流入,从而不能有效的处理动态、未知的特征空间下的因果结构学习问题。
发明内容
本发明为克服现有技术存在的不足之处,提出了一种基于流特征的因果结构学习方法,以期能够从具有流特征的线性任意分布的数据中发现蕴含的因果结构关系,同时降低学习的时间复杂度,从而满足在线学习的时效性要求。
本发明为解决技术问题采用如下技术方案:
本发明一种基于流特征的因果结构学习方法的特点是按如下步骤进行:
步骤1、定义时刻t;并初始化t=0;定义特征个数极限值为max;
步骤2、定义特征集为EF,并初始化第t时刻的特征集为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610032838.8/2.html,转载请声明来源钻瓜专利网。