[发明专利]一种基于流处理的模式更新方法在审
申请号: | 201610986675.7 | 申请日: | 2016-11-09 |
公开(公告)号: | CN106570172A | 公开(公告)日: | 2017-04-19 |
发明(设计)人: | 杨定裕 | 申请(专利权)人: | 上海电机学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海申汇专利代理有限公司31001 | 代理人: | 翁若莹,吴小丽 |
地址: | 201100 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于流处理的模式更新方法,首先进行模式定义,然后建立模式索引,再采用流处理方法接收新模式,接着进行模式查找,最后进行模式更新。方法采用一种基于kd‑tree的模式存储,这种方法可以把一系列模式分配到一个二叉树中,模式存储根据一定的规则进行排列。当需要更新时,可以遍历二叉树来进行查找模式节点,然后对模式进行状态更新。与传统的顺序查找相比,本方法在模式查找时,无需查找遍历整个模式集,只需要查找部分分支节点,因而本方法能够减少遍历的空间,从而提升模式查找的速度。该方法能够实现模式的实时状态更新,并支持快速的模式更新,具有模式更新速度快、并发性高、吞吐量高等优点。 | ||
搜索关键词: | 一种 基于 处理 模式 更新 方法 | ||
【主权项】:
一种基于流处理的模式更新方法,其特征在于,该方法由以下5个步骤组成:步骤1、模式定义模式是一系列具有一定的有序性的数据,其在历史数据中经常出现;模式P的定义如下:P=<Id,D{x1,…,xh},T{t1,t2…}>其中,其中,Id是模式的唯一标识码;D是一个数据集合,包含了本模式的所有数据,x1,...,xh表示模式的具体数值;T是模式出现时间的集合,t1、t2……表示模式出现的具体时间;步骤2、建立模式索引建立一个基于kd‑tree的索引结构存储模式;由于一个模式具有一定的长度h,即相当于每个模式具有h个特征维度,因而使用h个维度对模式进行划分;每个层次划分时,先在一个区别最大的维度作为切分维度,并在这个维度上选择中位数的模式作为分支节点,然后存储在一个二叉树中,二叉树的深度为log(n),其中n是模式总个数;步骤3、采用流处理方法接收新模式采用流处理的架构处理新模式,当系统接收到一个新模式P时,动态地创建一个更新任务Task;当系统连续接收到多个模式时,系统将对每个更新任务进行分析,根据模式的发生时间进行排序后依次处理;步骤4、模式查找每个更新任务Task首先需要从所有模式中找到对应的模式P′,即满足两个模式的数据序列D是完全匹配的,P′.D=P.D,Task先遍历kd‑tree,从根节点root开始,依次查找整个树,直到找到P′或者遍历完整个树;步骤5、模式更新根据步骤4的查找结果,对模式进行更新,如找到对应的模式P′,则对模式P′的状态进行更新,在P′.T的发生时间集合中追加当前模式的发生时间,即P′.T=P.T∪P′.T。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610986675.7/,转载请声明来源钻瓜专利网。