[发明专利]一种小样本条件下的因果关系发现方法及系统在审
申请号: | 202210027724.X | 申请日: | 2022-01-11 |
公开(公告)号: | CN114428795A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 杨文婧;徐利洋;王戟;梁卓;颜豪杰;孙太梧 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 刘芳 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 条件下 因果关系 发现 方法 系统 | ||
本发明公开了一种小样本条件下的因果关系发现方法及系统。方法包括S1、初始化以变量为节点的无向完全图H;S2、设定整数变量n=0;S3、枚举H顶点中的有序节点对x,y,使得x,y相邻,设定集合Z=adjacentH(x)\{y}的节点数不小于n,且N/(z1·z2·…·zm)≥40,若H顶点中符合条件的有序节点对已枚举完毕,则跳转至步骤S6;S4、枚举集合Z的子集S;S5、跳转至步骤S3;S6、将整数变量n加1;S7、若存在x和y使得x,y相邻且集合adjacentH(x)\{y}的节点数不小于n,则跳转至步骤S2;S8、枚举H顶点中的有序节点元组x,y,z;S9、反复按照预设规则将H中的无向边转化成有向边。本发明能避免不必要的迭代,提升因果关系发现方法整体执行效率。
技术领域
本发明涉及数据处理技术领域,更具体地说,特别涉及一种小样本条件下的因果关系发现方法及系统。
背景技术
在大数据的时代,因果关系发现作为知识发现的手段非常重要。因果关系发现是为了查找数据集合中存在的数据关联。为了判断数据集中两个变量是否相互依赖,需要使用统计学中独立性检验的方法(如卡方检验、Fisher精确检验)检验两个变量在某些变量被控制时是否相互独立。为了发现数据之间的因果关联,需要使用因果关系发现方法,期间使用独立性检验方法。现有的因果关系发现方法有SGS方法、PC方法、FCI方法等。
这些现有的因果关系发现方法处理小样本数据时效率较低,故需要一种适应于小样本数据的因果关系发现方法及系统。
发明内容
本发明的目的在于提供一种小样本条件下的因果关系发现方法及系统,以克服现有技术所存在的缺陷。
为了达到上述目的,本发明采用的技术方案如下:
一种小样本条件下的因果关系发现方法,包括以下步骤:
S1、初始化以变量为节点的无向完全图H;
S2、设定整数变量n=0;
S3、枚举H顶点中的有序节点对x,y,使得x,y相邻,设定集合Z=adjacentH(x)\{y}的节点数不小于n,且N/(z1·z2·…·zm)≥40,若H顶点中符合条件的有序节点对已枚举完毕,则跳转至步骤S6,其中,N为样本容量,z1,z2,…,zm为Z变量节点集合中每个变量的取值个数;
S4、枚举集合Z的子集S,其中S的节点数为n,若在S控制下x和y相互独立则删除x和y之间的边;
S5、跳转至步骤S3;
S6、将整数变量n加1;
S7、若存在x和y使得x,y相邻且集合adjacentH(x)\{y}的节点数不小于n,则跳转至步骤S2;
S8、枚举H顶点中的有序节点元组x,y,z,若x和y之间存在一条无向边,y和z之间也存在一条无向边,且在任意包含y的节点集控制下x和z不相互独立,则将这两条无向边换成x→y和z→y;
S9、反复按照预设规则将H中的无向边转化成有向边,直至没有可以根据这些规则进行转化的无向边;所述预设规则为:
(1)若在H中,x和y之间存在无向边(x,y),z指向x,z和y不相邻,则将H中的无向边(x,y)变成有向边x→y;
(2)若在H中,x和y之间存在无向边(x,y)和一条从x到y的有向通路,则将H中的无向边(x,y)变成有向边x→y。
上文所述步骤S3中的x,y相邻意为x和y之间存在边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210027724.X/2.html,转载请声明来源钻瓜专利网。