[发明专利]一种基于领域本体的语义工作流索引构造及检索方法有效

申请号：	201910754733.7	申请日：	2019-08-15
公开（公告）号：	CN110457490B	公开（公告）日：	2021-06-18
发明（设计）人：	孙晋永;赵响	申请（专利权）人：	桂林电子科技大学
主分类号：	G06F16/36	分类号：	G06F16/36;G06F16/31;G06F16/33;G06Q10/10
代理公司：	桂林市华杰专利商标事务所有限责任公司 45112	代理人：	杨雪梅
地址：	541004 广***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于领域本体语义工作流索引构造检索方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于领域本体的语义工作流索引构造及检索方法，其特征在于，包括如下步骤：

1)建立语义工作流的领域任务本体和领域数据本体；

2)构造语义工作流的结构特征索引SWStructIndex及其检索方法，索引SWStructIndex包括一步路径索引Path1Index、数据-工作流索引DataIndex、数据-任务索引DataTaskIndex和两步路径索引Path2Index；

3)构造语义工作流的行为特征索引SWBebavIndex及其检索方法，索引SWBebavIndex包括任务因果关系索引CasualIndex、任务互斥关系索引ExclusiveIndex、任务并行关系索引ParalellIndex和任务循环关系索引LoopIndex；

4)当与控制流、数据流相关的多个查询条件组合时，检索方法为：首先，执行满足控制流或数据流相关的每个查询条件的语义工作流或任务集合检索任务；然后，计算所有查询结果集的交集作为最终结果集返回；

5)更新语义工作流的结构和行为特征索引：当一个新语义工作流加入语义工作流库时，结构特征索引SWStructIndex和行为特征索引SWBebavIndex均可以增量构造；当从语义工作流库中删除语义工作流时，先记录该工作流，待被删除的语义工作流达到设定数量后，一次将它们涉及的索引项删除或更新；

步骤2)中，所述的一步路径索引Path1Index，索引项的形式为(task,S₁)，其中task为任务节点，S₁为包含task的语义工作流集合；

一步路径索引Path1Index的构造方法为：首先，获取语义工作流库SWC中某语义工作流SW的任务节点集合TS；然后，若某任务节点task∈TS在索引Path1Index中不存在，则先新建一个索引项(task,S₁)，将SW的ID加入集合S₁中；若task已存在，则直接将SW的ID加入task对应索引项的集合S₁中；遍历SW的任务节点集合TS、语义工作流库SWC，建立索引Path1Index；将索引Path1Index存储为(task.hashcode,S₁.pointer)，其中task.hashcode为一步路径或任务节点task的语义描述的哈希值，S₁.pointer指向语义工作流集合S₁的存储位置；

一步路径索引Path1Index的检索方法为：对于给定的查询任务节点qtask，若qtask在索引Path1Index中已存在，则直接返回qtask对应索引项的集合S₁；若qtask在索引中不存在，说明在语义工作流库SWC中不存在包含qtask的语义工作流，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域任务本体中查询qtask的语义描述对应概念C的直接子概念C₁，然后获取包含C₁对应任务节点的语义工作流集合，遍历概念C的所有直接子概念得到多个这样的集合，最后计算这些集合的并集作为S₁返回；

所述的数据-工作流索引DataIndex，包括输入数据-工作流索引Data_InIndex和输出数据-工作流索引Data_OutIndex两种；

i)输入数据-工作流索引Data_InIndex的索引项形式为(data_In,S₂)，其中data_In为语义工作流的输入数据对象，S₂为输入数据对象集合包含data_In的语义工作流集合；

输入数据-工作流索引Data_InIndex的构造方法为：首先，获取语义工作流库SWC中某语义工作流SW的输入数据对象集合DS_In；然后，若data_In∈DS_In在索引Data_InIndex中不存在，则新建一个索引项(data_In,S₂)，将SW的ID加入集合S₂中，若data_In已存在，则直接将SW的ID加入S₂，遍历SW的输入数据对象集合DS_In、语义工作流库SWC，建立索引Data_InIndex；将索引Data_InIndex存储为(data_In.hashcode,S₂.pointer)，其中data_In.hashcode为数据对象data_In的语义描述的哈希值，S₂.pointer指向语义工作流集合S₂的存储位置；

输入数据-工作流索引Data_InIndex的检索方法为：对于给定的查询数据节点qdata_In，若qdata_In在索引Data_InIndex中已存在，则直接返回qdata_In对应索引项的集合S₂；若qdata_In在索引中不存在，说明SWC中不存在输入数据对象集合包含qdata_In的语义工作流，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域数据本体中查询qdata_In的语义描述对应概念C的直接子概念C₁，然后获取输入数据对象集合包含C₁对应任务节点的语义工作流集合，遍历概念C的所有直接子概念得到多个这样的集合，最后计算这些集合的并集作为S₂返回；

ii)输出数据-工作流索引Data_OutIndex的索引项形式为(data_Out,S₃)，其中data_Out为语义工作流的输出数据对象，S₃为输出数据对象集合包含data_Out的语义工作流集合；

输出数据-工作流索引Data_OutIndex的构造方法为：首先，获取语义工作流库SWC中某语义工作流SW的输出数据对象节点集合DS_Out；然后，若data_Out∈DS_Out在索引Data_OutIndex中不存在，则新建一个索引项(data_Out,S₃)，将SW的ID加入集合S₃中，若data_Out已存在，则直接将SW的ID加入S₃；遍历集合DS_Out、语义工作流库SWC，建立索引Data_OutIndex；将索引Data_OutIndex存储为(data_Out.hashcode,S₃.pointer)，其中data_Out.hashcode为数据对象data_Out的语义描述的哈希值，S₃.pointer指向语义工作流集合S₃的存储位置；

输出数据-工作流索引Data_OutIndex的检索方法为：对于给定的查询数据节点qdata_Out，若qdata_Out在索引Data_OutIndex中已存在，则直接返回qdata_Out对应索引项的集合S₃；若qdata_Out在索引中不存在，说明SWC中不存在输出数据对象集合包含qdata_Out的语义工作流，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域数据本体中查询qdata_Out的语义描述对应概念C的直接子概念C₁，获取输出数据对象集合包含C₁对应任务节点的语义工作流集合；遍历概念C的所有直接子概念得到多个这样的集合，最后计算这些集合的并集作为S₃返回；

所述的数据-任务索引DataTaskIndex，包括输入数据-任务索引Data_InTaskIndex和输出数据-任务索引Data_OutTaskIndex两种；

i)索引Data_InTaskIndex的索引项形式为(data_In,TS₁)，其中data_In为语义工作流的输入数据对象，TS₁的形式为{(task,SW)}，为输入数据对象集合包含data_In的任务节点task及其所属语义工作流SW的集合；

数据-任务索引DataTaskIndex的构造方法为：首先，获取语义工作流库SWC中某语义工作流SW的输入数据对象集合DS_In；然后，若data_In∈DS_In在索引Data_InTaskIndex中不存在，则新建一个索引项(data_In,TS₁)，将SW中消耗data_In的每个任务节点task的ID标识taskID加入集合TS₁中，若data_In已存在，则直接SW中消耗data_In的每个任务节点task的ID标识taskID加入TS₁；遍历SW的输入数据对象集合DS_In、语义工作流库SWC，建立索引Data_InTaskIndex；将索引Data_InTaskIndex存储为(data_In.hashcode,TS₁.pointer)，其中data_In.hashcode为数据对象data_In的语义描述的哈希值，TS₁.pointer指向任务节点集合TS₁的存储位置；

数据-任务索引DataTaskIndex的检索方法为：对于查询数据对象qdata_In，若qdata_In在索引Data_InTaskIndex中已存在，则直接返回qdata_In对应索引项的任务节点集合TS₁；若qdata_In在索引中不存在，说明SWC中不存在输入数据对象集合包含qdata_In的任务节点，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域数据本体中查询qdata_In的语义描述对应概念C的直接子概念C₁，然后获取输入数据对象集合包含C₁所指代数据对象的任务节点集合；遍历概念C的所有直接子概念得到多个这样的集合，最后计算这些集合的并集作为TS₁返回；

ii)索引Data_OutTaskIndex的索引项形式为(data_Out,TS₂)，其中data_Out为语义工作流的输出数据对象，TS₂的形式为{(task,SW)}，为输出数据对象集包含data_Out的任务节点task及其所属语义工作流SW的集合；

索引Data_OutTaskIndex的构造方法为：首先，获取语义工作流库SWC中某语义工作流SW的输出数据对象节点集合DS_Out；然后，若data_Out∈DS_Out在索引Data_OutTaskIndex中不存在，则新建一个索引项(data_Out,TS₂)，将SW中生成data_Out的任务节点task的ID标识taskID加入集合TS₂中，若data_Out已存在，则直接将SW中生成data_Out的任务节点task的ID标识taskID加入TS₂；遍历集合DS_Out、语义工作流库SWC，建立索引Data_OutTaskIndex；将索引Data_OutTaskIndex存储为(data_Out.hashcode,TS₂.pointer)，其中data_Out.hashcode为数据对象data_Out的语义描述的哈希值，TS₂.pointer指向任务节点集合TS₂的存储位置；

索引Data_OutTaskIndex的检索方法为：对于给定的查询数据对象qdata_Out，若qdata_Out在索引Data_OutTaskIndex中已存在，则直接返回qdata_Out对应索引项的任务节点集合TS₂；若qdata_Out在索引中不存在，说明SWC中不存在输出数据对象集合包含qdata_Out的任务节点，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域数据本体中查询qdata_Out的语义描述对应概念C的直接子概念C₁，然后获取输出数据对象集合包含C₁所指代数据对象的任务节点集合；遍历概念C的所有直接子概念得到多个这样的集合，最后计算这些集合的并集作为TS₂返回；

所述的两步路径索引Path2Index，索引项形式为(task₁,task₂，S₄)，其中task₁,task₂为任务节点task₁,task₂组成的两步路径“task₁→task₂”的序偶形式，S₄为语义工作流对应的语义标注图的某一路径上包含路径“task₁→task₂”的语义工作流集合；

两步路径索引Path2Index的构造方法为：首先，获取语义工作流库SWC中某语义工作流SW对应语义标注图中的所有相邻任务节点对集合TA，然后，若ta∈TA在索引Path2Index中不存在，则先新建一个索引项(task₁,task₂,S₄)，将SW的ID加入集合S₄，若ta已存在，则直接将SW的ID加入S₄；遍历SW的集合TA，以及SWC中的所有语义工作流，构建索引Path2Index；将索引Path2Index存储为(task₁,task₂.hashcode,S₄.pointer)，其中task₁,task₂.hashcode为两步路径task₁,task₂的语义描述的哈希值，S₄.pointer指向语义工作流S₄的存储位置；

两步路径索引Path2Index的检索方法为：对于查询相邻任务节点对qtask₁,qtask₂，若路径qtask₁,qtask₂在索引Path2Index中已存在，则直接返回qtask₁,qtask₂对应索引项的集合S₄；若路径qtask₁,qtask₂不存在，说明在SWC中不存在包含路径qtask₁,qtask₂的语义工作流，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域任务本体中分别获取qtask₁、qtask₂的语义描述C₁、C₂的直接子概念的集合CS₁、CS₂，然后获取包含笛卡尔积CS₁×CS₂中的每个概念序偶(C₃,C₄)指代的任务节点两步路径的语义工作流集合，最后计算这些集合的并集作为S₄返回；

步骤3)中，所述的任务因果关系索引CasualIndex，索引项的形式为(task₁,task₂,S₅)，其中task₁,task₂为具有因果关系的任务节点task₁,task₂组成的序偶，S₅为包含此序偶的语义工作流集合；

任务因果关系索引CasualIndex的构造方法：首先，对于语义工作流库SWC中的某语义工作流SW，使用完全前缀展开法和最近公共前驱法计算SW的任务因果关系序偶集合TC，然后，若tc∈TC在索引CasualIndex中不存在，则先新建一个索引项(task₁,task₂,S₅)，将SW的ID加入集合S₅中；若tc已存在，则直接将SW的ID加入S₅；遍历SW的集合TC，语义工作流库SWC，建立索引CasualIndex，将索引CasualIndex存储为(task₁,task₂.hashcode,S₅.pointer)，其中task₁,task₂.hashcode为任务因果关系task₁,task₂的语义描述的哈希值，S₅.pointer指向语义工作流集合S₅的存储位置；

任务因果关系索引CasualIndex的检索方法为：对于查询任务因果关系qtask₁,qtask₂，若qtask₁,qtask₂在索引CasualIndex中已存在，则直接返回qtask₁,qtask₂对应索引项的集合S₅，若qtask₁,qtask₂在索引中不存在，说明SWC中不存在包含因果任务节点对qtask₁,qtask₂的语义工作流，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域任务本体中分别获取qtask₁、qtask₂的语义描述C₁、C₂的直接子概念的集合CS₁、CS₂，然后获取包含笛卡尔积CS₁×CS₂中的每个概念序偶(C₃,C₄)指代的任务因果关系的语义工作流集合，最后计算这些集合的并集作为S₅返回；

所述的任务并行关系索引ParalellIndex，索引项的形式为(task₁,task₂,S₆)，其中task₁,task₂为具有并行关系的任务节点task₁,task₂组成的序偶，S₆为包含此序偶的语义工作流集合；

任务并行关系索引ParalellIndex的构造方法为：首先，对于语义工作流库SWC中的语义工作流SW，使用完全前缀展开法和最近公共前驱法计算SW的任务并行关系集合TP；然后，若tp∈TP在索引ParalellIndex中不存在，则先新建一个索引项(task₁,task₂,S₆)，将SW的ID加入集合S₆中；若tp已存在，则直接将SW的ID加入S₆；遍历SW的集合TP，语义工作流库SWC，建立索引ParalellIndex；将索引ParalellIndex存储为(task₁,task₂.hashcode,S₆.pointer)，其中task₁,task₂.hashcode为任务并行关系task₁,task₂的语义描述的哈希值，S₆.pointer指向语义工作流集合S₆的存储位置；

任务并行关系索引ParalellIndex的检索方法为：对于查询任务并行关系qtask₁,qtask₂，若qtask₁,qtask₂在索引ParalellIndex中已存在，则直接返回qtask₁,qtask₂对应索引项的集合S₆，若qtask₁,qtask₂在索引中不存在，说明SWC中不存在包含并行任务节点对qtask₁,qtask₂的语义工作流，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域任务本体中分别获取qtask₁、qtask₂的语义描述C₁、C₂的直接子概念的集合CS₁、CS₂，然后获取包含笛卡尔积CS₁×CS₂中的每个概念序偶(C₃,C₄)指代的任务并行关系的语义工作流集合，最后计算这些集合的并集作为S₆返回；

所述的任务互斥关系索引ExclusiveIndex，索引项的形式为(task₁,task₂,S₇)，其中task₁,task₂为具有互斥关系的任务节点task₁,task₂组成的序偶，S₇为包含此序偶的语义工作流集合；

任务互斥关系索引ExclusiveIndex的构造方法为：首先，对于语义工作流库SWC中的某语义工作流SW，使用完全前缀展开法和最近公共前驱法计算SW的任务互斥关系集合TE；然后，若te∈TE在索引ExclusiveIndex中不存在，则先新建一个索引项(task₁,task₂,S₇)，将SW的ID加入集合S₇中，若te已存在，则直接将SW的ID加入S₇；遍历SW的集合TE，语义工作流库SWC，建立索引ExclusiveIndex；将索引ExclusiveIndex存储为(task₁,task₂.hashcode,S₇.pointer)，其中task₁,task₂.hashcode为任务互斥关系task₁,task₂的语义描述的哈希值，S₇.pointer指向语义工作流集合S₇的存储位置；

任务互斥关系索引ExclusiveIndex的检索方法为：对于查询任务互斥关系qtask₁,qtask₂，若qtask₁,qtask₂在索引ExclusiveIndex中已存在，则直接返回qtask₁,qtask₂对应索引项的集合S₇，若qtask₁,qtask₂在索引中不存在，说明SWC中不存在包含互斥任务节点对qtask₁,qtask₂的语义工作流，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域任务本体中分别获取qtask₁、qtask₂的语义描述C₁、C₂的直接子概念的集合CS₁、CS₂，然后获取包含笛卡尔积CS₁×CS₂中的每个概念序偶(C₃,C₄)指代的任务互斥关系的语义工作流集合，最后计算这些集合的并集作为S₇返回；

所述的任务循环关系索引LoopIndex，索引项的形式为(task₁,task₂,S₈)，其中task₁,task₂为具有循环关系的任务节点task₁,task₂组成的序偶，S₈为包含此序偶的语义工作流集合；

任务循环关系索引LoopIndex的构造方法为：首先，对于语义工作流库SWC中的语义工作流SW，使用完全前缀展开法、最近公共前驱法和循环结构判断法计算SW的任务循环关系集合TL；然后，若tl∈TL在索引LoopIndex中不存在，则先新建一个索引项(task₁,task₂,S₈)，将SW的ID加入集合S₈中，若tl已存在，则直接将SW的ID加入S₈；遍历SW的集合TL，语义工作流库SWC，建立索引LoopIndex；将索引LoopIndex存储为(task₁,task₂.hashcode,S₈.pointer)，其中task₁,task₂.hashcode为任务循环关系task₁,task₂的语义描述的哈希值，S₈.pointer指向语义工作流集合S₈的存储位置；

任务循环关系索引LoopIndex的检索方法为：对于查询任务循环关系qtask₁,qtask₂，若qtask₁,qtask₂在索引LoopIndex中已存在，则直接返回qtask₁,qtask₂对应索引项的集合S₈；若qtask₁,qtask₂在索引中不存在，说明SWC中不存在包含循环任务节点对qtask₁,qtask₂的语义工作流，则基于本体中父子概念间的较高语义相似性，使用子概念代替父概念；先在领域任务本体中分别获取qtask₁、qtask₂的语义描述C₁、C₂的直接子概念的集合CS₁、CS₂，然后获取包含笛卡尔积CS₁×CS₂中的每个概念序偶(C₃,C₄)指代的任务循环关系的语义工作流集合，最后计算这些集合的并集作为S₈返回。

2.根据权利要求1所述的一种基于领域本体的语义工作流索引构造及检索方法，其特征在于，步骤1)中，具体是将语义工作流库中的语义工作流任务节点的语义描述看作与任务相关的概念，利用概念间的包含关系，构建任务本体的层次结构，建立领域任务本体；将语义工作流的数据对象节点的语义描述看作与数据对象相关的概念，利用概念间的包含关系，构建数据本体的层次结构，建立领域数据本体。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学，未经桂林电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910754733.7/1.html，转载请声明来源钻瓜专利网。

上一篇：资源调度方法及系统、计算机可读存储介质
下一篇：一种基于游离状态节点的知识图谱重构方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于领域本体的语义工作流索引构造及检索方法有效

专利文献下载