[发明专利]一种面向海量流式数据的分布式实时规则推理方法和装置在审
申请号: | 201810192439.7 | 申请日: | 2018-03-09 |
公开(公告)号: | CN108549939A | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 乔颖;王孟玄;王宏安 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/00;G06N3/12 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推理 就绪队列 空队列 方法和装置 物联网应用 规则推理 流式数据 数据操作 规则图 截止期 匹配 优先级递减顺序 海量实时数据 分布式环境 继续执行 时间约束 作业执行 规则集 图生成 智能化 放入 可用 删除 创建 分配 转化 | ||
1.一种面向海量流式数据的分布式实时规则推理方法,其特征在于,包括以下步骤:
1)建立规则集所对应的规则图;
2)将规则图转化成相应的数据操作图;
3)根据数据操作图生成推理作业;
4)根据各个推理作业对应规则的截止期设置推理作业的优先级,并将推理作业按照优先级递减顺序放入推理作业就绪队列;
5)选择优先级最高的推理作业,创建并执行推理任务;
6)推理作业执行结束时将其从所述推理作业就绪队列中删除,并判断所述推理作业就绪队列是否为空队列:若不是空队列则回到步骤5)继续执行;若是空队列则表示已完成输入事实与所有规则的匹配。
2.如权利要求1所述的方法,其特征在于,步骤1)所述规则图用RETE网表示,规则的约束条件被表示成α节点或者β节点,每个α节点有一个α内存,用来存储符合α节点对应约束的所有事实;每个β节点有一个β内存,用来存储满足β节点所对应约束的部分匹配。
3.如权利要求2所述的方法,其特征在于,步骤2)所述数据操作图为一个有向无环图,图中各节点表示一个数据集,即在规则推理过程中被操作的相关数据,对应各α节点与各β节点的α内存和β内存中的事实和部分匹配;各节点所表示的数据集被划分为多个数据分区,一个节点上各数据分区可被并行计算。
4.如权利要求3所述的方法,其特征在于,步骤2)包括:
2.1)依次处理RETE网络中的α节点,在数据操作图中加入一个新节点表示当前α节点对应的α内存中的数据;对于RETE网络中的两个α节点x,y,若存在边<x,y>,则在数据操作图中添加边<vx,vy>,其中vi表示α节点i对应的α内存中所有事实形成的数据集Di,i={x,y},且边表示的操作为过滤数据集Dx中不符合α节点y所对应约束的事实,从而得到数据集Dy;
2.2)依次处理RETE网络中的β节点,在数据操作图中加入一个新节点表示当前β节点对应的β内存中的数据;对于RETE网络中的α节点x和β节点y,若其拥有共同的后继β节点z,则在数据操作图中添加边<vx,vz>和边<vy,vz>,其中vi表示α节点i对应的α内存中所有事实形成的数据集Di,i={x,y,z},且两条边表示的操作为对数据集Dx和数据集Dy进行笛卡尔积,再过滤这些笛卡尔积中不符合β节点z所对应的不同条件元素间约束的部分匹配,从而得到数据集Dz。
5.如权利要求1所述的方法,其特征在于,步骤3)使用宽度优先遍历找到数据操作图中各个终止节点的所有祖先节点,为每个终止节点及其祖先节点所构成的子图上所有数据集的一系列数据集操作生成推理作业。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810192439.7/1.html,转载请声明来源钻瓜专利网。