[发明专利]一种基于确定性机制与噪声干扰的离散数据因果发现方法在审
申请号: | 201810223735.9 | 申请日: | 2018-03-19 |
公开(公告)号: | CN108595501A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 乔杰;蔡瑞初;郝志峰;温雯;王丽娟;陈炳丰 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
地址: | 510006 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定性 评分标准 噪声干扰 离散数据 评估模型 贪婪策略 发现 因果方向 噪声机制 反方向 预设 输出 灵活 引入 | ||
本发明公开了一种基于确定性机制与噪声干扰的离散数据因果发现方法,包括以下步骤:S1、预设模型X→Y′→Y,定义确定性因果过程;S2、定义得到用于评估模型X→Y'→Y的初始评分标准;S3、计算出用于评估模型的最终评分标准;S4、根据最终评分标准所给出的评分,使用贪婪策略估计Y'的状态,得到模型M1:X→Y'→Y;S5、根据最终评分标准所给出的评分,使用贪婪策略估计反方向的X'的状态,得到模型M2:Y→X'→X;S6、根据比较M1,M2的评分S1,S2的大小,并输出因果方向。本发明通过引入确定性与噪声干扰两部分,使之灵活适应数据中不同的确定性机制和噪声机制,增加抗干扰性,增大了其适用范围,克服了现有技术中离散因果发现效率低下的缺陷,达到提高因果发现效率的目的。
技术领域
本发明涉及数据挖掘技术领域,更具体地说,涉及一种基于确定性机制与噪声干扰的离散数据因果发现方法。
背景技术
随着社会进步和科技发展,人们需要认识的事物变得越来越复杂,系统内部的因果关系是客观存在的,因果发现就是从数据中挖掘其蕴含的因果关系,从而帮助人们认识事物间的客观规律。
在最近的研究中,基于加性噪声模型的因果发现被推广到了离散数据上,通过X与噪声N的独立性这一不对称性进行方向识别:Y=f(X)+N,X⊥N;一个值得讨论的问题是,在离散数据中,因果机制是否满足以上使用加法运算的模型。一方面,有人认为基于离散数据的加性噪声模型可以通过考虑有一个随机的f映射,从而可以将离散加性噪声模型扩展为混合模型。而另一方面,有人认为在离散的数据中,可以通过判断P(X)与P(Y|X)的独立性来进行方向识别。然而这些方法,在离散数据中,因果的产生机制未必能满足加性噪声的假设,我们需要寻找一个更为一般的模型来解释离散的因果机制。
目前经典的因果发现发放都不能有效克服了更加一般条件下的离散因果发现问题,这些方法的主要局限是:面对离散的数据,大部分存在马尔科夫等价类问题,他们依赖于基于约束的方法,依赖于大量的独立性检验,但两个结点的情况下是无法判断方向的,从而造成因果发现效率低下。
发明内容
有鉴于此,本发明提供了一种基于确定性机制与噪声干扰的离散数据因果发现方法,克服了现有技术中离散因果发现效率低下的缺陷。
一种基于确定性机制与噪声干扰的离散数据因果发现方法,其步骤包括有:
S1、预设模型X→Y′→Y,定义确定性因果过程;
S2、定义得到用于评估模型X→Y′→Y的初始评分标准;
S3、计算得到用于评估模型X→Y′→Y的最终评分标准;
S4、根据最终评分标准所给出的评分,使用贪婪策略估计Y′的状态,得到模型M1:X→Y′→Y;
S5、根据最终评分标准所给出的评分,使用贪婪策略估计反方向的X′的状态,得到模型M2:Y→X′→X;
S6、根据比较M1,M2的评分S1,S2的大小,并输出因果方向。
作为本发明的优选方案,所述步骤S1的具体过程为:若有两个变量,X,Y,如果X是Y的原因,则我们称,X→Y,其中该因果模型包含了确定性机制与噪声干扰两个部分,第一部分,确定性机制,我们认为因变量X到真实状态下的果变量Y′是一个确定性机制,即可以表示为Y’=f(x),其中f是一个离散的映射函数;第二部分为噪声干扰部分,Y’经过噪声干扰,从而得到观测到的果变量Y,即,该过程可以表示为,X→Y′→Y。
作为本发明的优选方案,所述步骤S2的具体过程为:给定的一组观察数据该模型X→Y′→Y的用于评估模型的初始评分标准为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810223735.9/2.html,转载请声明来源钻瓜专利网。