[发明专利]一种适用于多个隐混杂因子数据的发现方法及系统在审
申请号: | 201811125577.X | 申请日: | 2018-09-26 |
公开(公告)号: | CN109325600A | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 蔡瑞初;陈薇;谢峰;郝志峰;陈炳丰;谢泳 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06F16/901;G06F16/9038 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
地址: | 510000 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种适用于多个隐混杂因子数据的因果网络发现方法及系统,该系统包括:用户输入数据模块、参数配置模块、因果骨架学习模块、局部因果顺序识别模块、隐混杂因子检测模块、因果网络构建模块、结果可视化模块。适用于多个隐混杂因子数据的因果网络发现系统能够根据用户的需求进行因果网络发现,然后可视化地呈现出观察变量间的因果网络。本发明考虑了多个隐混杂因子的情况,利用因果骨架的信息大大降低求解的复杂度,同时检测出隐混杂因子的个数及其影响的观察变量,使因果网络的学习和识别正确率高,解决了在含有多个隐混杂因子数据的情况下无法正确发现因果网络的问题。本发明实施简单,学习准确率高,具有很强的实际价值和现实意义。 | ||
搜索关键词: | 因果网络 混杂 因子数据 发现 参数配置模块 用户输入数据 可视化模块 发现系统 构建模块 现实意义 学习模块 因果顺序 因子检测 复杂度 可视化 正确率 准确率 求解 观察 检测 学习 | ||
【主权项】:
1.一种适用于多个隐混杂因子数据的因果网络发现方法,其特征在于,包括以下步骤:S1)、设置观察数据集X=[x1,x2,…,xN],其中每个变量xi包括p个样本数据,并假定存在未知维度和相同数量的隐混杂因子集Z=[z1,z2,…,zM],并设置前部因果顺序集Khead,及尾部因果次序集Ktail为空集,记录包含观察数据集的候选变量集U={x1,x2,…,xN};S2)、从一个完全无向图出发,利用(条件)独立性检验的方法学习观察数据之间的因果骨架图G,并记录下每个观察变量xi的邻接变量Adj(G,xi);S3)、自上而下寻找每个变量xi可识别的外生变量;S4)、更新U=U\Khead,自下而上寻找可识别的叶子节点;S5)、将步骤S2)中获得的因果骨架图G按最大团分成多个变量子集S=[s1,s2,....,sL];S6)、保留S中包含U中元素的子集集合,更新S;S7)、对S中每个集合si,重复步骤S3)和步骤S4)找出更多的外生变量和叶子节点,得到更多的因果顺序Klist,如果存在两个或两个以上变量之间无法判断其因果顺序,那么就说明他们受到同一个隐混杂因子的影响;S8)、结合Khead、Ktail、Klist的信息为因果骨架图G定向,对于排在任意变量前面的所有变量进行多元最小二乘回归,得到互相有因果关系的变量之间的因果强度,构建因果关系网络。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811125577.X/,转载请声明来源钻瓜专利网。