[发明专利]一种基于确定性机制与噪声干扰的离散数据因果发现方法在审
申请号: | 201810223735.9 | 申请日: | 2018-03-19 |
公开(公告)号: | CN108595501A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 乔杰;蔡瑞初;郝志峰;温雯;王丽娟;陈炳丰 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
地址: | 510006 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定性 评分标准 噪声干扰 离散数据 评估模型 贪婪策略 发现 因果方向 噪声机制 反方向 预设 输出 灵活 引入 | ||
1.一种基于确定性机制与噪声干扰的离散数据因果发现方法,其特征在于,该离散数据上基于确定性机制与噪声干扰下的因果发现方法的步骤包括有:
S1、预设模型X→Y'→Y,定义确定性因果过程;
S2、定义得到用于评估模型X→Y'→Y的初始评分标准;
S3、计算得到用于评估模型X→Y'→Y的最终评分标准;
S4、根据最终评分标准所给出的评分,使用贪婪策略估计Y′的状态,得到模型M1:X→Y'→Y;
S5、根据最终评分标准所给出的评分,使用贪婪策略估计反方向的X'的状态,得到模型M2:Y→X'→X;
S6、根据比较M1,M2的评分S1,S2的大小,并输出因果方向。
2.如权利要求1所述的一种基于确定性机制与噪声干扰的离散数据因果发现方法,其特征在于,所述步骤S1的具体过程为:若有两个变量,X,Y,如果X是Y的原因,则我们称,X→Y,其中该因果模型包含了确定性机制与噪声干扰两个部分,第一部分,确定性机制,我们认为因变量X到真实状态下的果变量Y′是一个确定性机制,即可以表示为Y’=f(x),其中f是一个离散的映射函数;第二部分为噪声干扰部分,Y’经过噪声干扰,从而得到观测到的果变量Y,即,该过程可以表示为,X→Y′→Y。
3.如权利要求1所述的一种基于确定性机制与噪声干扰的离散数据因果发现方法,其特征在于,所述步骤S2的具体过程为:给定的一组观察数据该模型X→Y′→Y的用于评估模型的初始评分标准为:
该式根据独立性X⊥Y|Y'分解为三个部分;第二个等式的第二项P(Y'=yi'|X=xi)表示了低秩隐变量产生的过程;由于这个过程是确定性的,我们有P(Y'=yi'|X=xi)=1当且仅当Y'=fxi时成立,否则为零,其中函数f xi表示真实映射。
4.如权利要求3所述的一种基于确定性机制与噪声干扰的离散数据因果发现方法,其特征在于,所述步骤S3的具体过程为:设其中分别表示PX,PY|Y'的极大似然解;他们的解可以写为其中和是值X=x和Y'=y',Y=y在样本中的频数,并且他们满足约束条件∑χax=1且∑y by',y=1;则用于评估模型的初始评分标准在数据D上最大化的解可以用下式表示,
根据BIC评分原理,得到最终用于评估模型的评分标准为,其中d=|X|-1+|X|+Y′| |Y|-1有效参数数量;|X|-1、|X|和|Y′| |Y|-1分别是P X、确定性映射f xi,和概率映射PY|Y’的有效参数数量,|X|、|Y′|和|Y|分别表示他们取值的个数。
5.如权利要求4所述的一种基于确定性机制与噪声干扰的离散数据因果发现方法,其特征在于,所述步骤S4的具体过程为:
S401、初始化阶段:产生x到y’的最大映射值,y’=f(x),其中,x的映射值为y,y’为x的全部映射值y的集合中出现次数最多的映射值;
S402、贪婪搜索阶段:根据用于评估模型的最终评分标准,对于每一个x,对其映射值f(x)进行一次更改操作,该操作每次只改变一个x对应的映射值,然后记录下更改后的评分,并恢复回初始状态;如此类推,更换将所有x对应的映射值都更换一遍,计算并记录这些更换操作后的评分;
S403、选择得分最高的更换操作作为下一轮迭代的初始值;
S404、重复步骤S402和S403,直到得分不再提升为止,从而得到模型M1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810223735.9/1.html,转载请声明来源钻瓜专利网。