[发明专利]一种可变间隔的去除重复流数据的会话窗口设计方法在审
申请号: | 201811643214.5 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109871248A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 何江;于伟;武新 | 申请(专利权)人: | 天津南大通用数据技术股份有限公司 |
主分类号: | G06F9/451 | 分类号: | G06F9/451;G08G1/065 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 杨慧玲 |
地址: | 300384 天津市滨海新区高新区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 去除 驱动器 会话窗口 可变间隔 流数据 窗口创建 窗口机制 输出窗口 预设规则 重复数据 合并 分配器 输出器 重复 分配 创建 | ||
1.一种可变间隔的去除重复流数据的会话窗口设计方法,其特征在于包括如下内容:
1)构建分配器,用于创建窗口并为窗口分配元素;
2)为每一个窗口构建驱动器,驱动器用于对窗口进行操作;
3)构建输出器,用于按照预设规则输出窗口中的元素;
4)为窗口创建合并机制。
2.根据权利要求1所述的一种可变间隔的去除重复流数据的会话窗口设计方法,其特征在于:所述窗口本身只是一个ID标识符。
3.根据权利要求1所述的一种可变间隔的去除重复流数据的会话窗口设计方法,其特征在于:每个驱动器包含一个定时器,用来决定一个窗口何时能够被计算或清除;驱动器的返回结果包括不做任何操作、处理窗口数据、移除窗口和窗口中的数据、处理窗口数据后销毁窗口。
4.根据权利要求1所述的一种可变间隔的去除重复流数据的会话窗口设计方法,其特征在于:所述输出器遍历窗口中的元素列表,并决定最先进入窗口的若干个元素需要被移除,将剩余的元素会传输给后续处理函数进行窗口的计算。
5.根据权利要求1所述的一种可变间隔的去除重复流数据的会话窗口设计方法,其特征在于:所述窗口的合并机制为通过设定合并条件,合并符合条件的窗口的底层状态与驱动器,来实现可变间隔与去除重复数据。
6.根据权利要求5所述的一种可变间隔的去除重复流数据的会话窗口设计方法,其特征在于:所述分配器会为新进入的元素分配一个窗口,窗口以元素的时间戳作为起始点,时间戳加会话超时时间为结束时间;当队列中已存在窗口时,每次新进入一个元素分配器建立窗口后,分配器会遍历现有的窗口,将这个元素的时间戳与上一个元素窗口的第一个元素的时间戳相比较,如果两者之间的差值超过预先设定的间隔,则认定为两个窗口;否则按照时间顺序合并两个窗口中的元素,并且保持每种元素仅出现一次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津南大通用数据技术股份有限公司,未经天津南大通用数据技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811643214.5/1.html,转载请声明来源钻瓜专利网。