[发明专利]一种基于噪音独立性的因果网络推断方法在审
申请号: | 201910790875.9 | 申请日: | 2019-08-26 |
公开(公告)号: | CN110598865A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 曾艳;郝志峰;蔡瑞初;谢峰;黄礼泊;陈炳丰 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06N5/04 | 分类号: | G06N5/04 |
代理公司: | 44102 广州粤高专利商标代理有限公司 | 代理人: | 林丽明 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 独立性 叶子节点 因果网络 集合 推断 噪音 数据集 构建 判定 独立成分分析 数据挖掘技术 初始化设置 最小二乘法 设置参数 列元素 行元素 剪枝 去除 存储 分解 输出 | ||
本发明涉及数据挖掘技术领域,提出一种基于噪音独立性的因果网络推断方法,包括以下步骤:获取n个变量并构建数据集X,初始化设置因果次序集合K;采用独立成分分析法分解数据集X;计算每个变量xi与每个噪音变量ej的独立性,并存储在矩阵Ind中;设置参数λ,计算叶子节点的判定矩阵M;计算变量xi与所有噪音变量ej的非独立性总和mi,并选择最大非独立性总和mi*所对应的节点xi*作为叶子节点;将叶子节点xi*对应的下标i*加入因果次序集合K中,并去除矩阵Ind和判定矩阵M中的第i*行元素及第i*列元素,至所有的变量xi的下标加入到因果次序集合K中;根据所述因果次序集合K构建因果网络推断图并利用最小二乘法对其进行剪枝,输出所述因果网络推断图。
技术领域
本发明涉及数据挖掘技术领域,更具体地,涉及一种基于噪音独立性的因果网络推断方法。
背景技术
在因果结构的推断工作中,贝叶斯网络(Bayesian Networks,BN)和结构方程模型(Structural Equation Model,SEM)被广泛应用,然而,针对因果结构的推断工作,在很多情况下,传统的因果推断算法并不能够估计出变量的完整结构,即,传统的因果推断算法只能找到马尔科夫等价类的结构,并不能得到唯一的结构。
Shimizu等人提出一种线性非高斯无环模型(Linear Non-Gaussian AcyclicModel,LiNGAM),它能够对数据的因果机制进行建模,并利用数据的非高斯性,有效解决上述传统的因果推断算法只能找到马尔科夫等价类结构的问题。针对这类模型的求解框架,主要分为三类:(1)基于独立成分分析法(ICA-LiNGAM)的框架;(2)借助贝叶斯评分方法的Bayes-LiNGAM的框架;(3)借助一对一似然比的DirectLiNGAM框架。然而,这类模型的求解框架仍存在一定的问题,其中,第一类框架与第二类框架利用ICA或者贝叶斯的方法,将原问题转换成一种目标优化问题来解决,但是容易陷入局部最优解,且第一类ICA-LiNGAM的框架通过ICA求解得到连接矩阵,利用连接矩阵的信息进行因果结构的学习,并没有直接利用噪音的信息;而第三类框架一般通过迭代寻找根节点的方式来获取因果次序,因此其需要不断地更新原始数据,导致计算复杂度高。
发明内容
本发明为克服上述现有技术所述的不能直接利用噪音的信息,计算复杂度高的缺陷,提供一种基于噪音独立性的因果网络推断方法。
为解决上述技术问题,本发明的技术方案如下:
一种基于噪音独立性的因果网络推断方法,包括以下步骤:
S1:获取n个变量并构建数据集X={x1,x2,...,xn},设置因果次序集合K=φ;
S2:采用独立成分分析法分解数据集X,得到X=AE,其中,E={e1,e2,..,en}为n个互相独立的噪音变量集合,A为连接矩阵;
S3:计算每个变量xi与每个噪音变量ej的独立性,并存储在矩阵Ind中,其中,i=1,2,...,n,j=1,2,...,n;
S4:设置参数λ,计算叶子节点的判定矩阵M;
S5:针对每一个变量xi计算其与所有噪音变量ej的非独立性总和mi,并选择最大非独立性总和mi*所对应的节点xi*作为叶子节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910790875.9/2.html,转载请声明来源钻瓜专利网。