[发明专利]流式计算的增量持久化方法、装置及存储介质有效
申请号: | 201811388343.4 | 申请日: | 2018-11-21 |
公开(公告)号: | CN111211993B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 程怡;石然;高伟康 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | H04L47/38 | 分类号: | H04L47/38;H04L47/62;H04L47/10;H04L47/41;G06F11/14 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 增量 持久 方法 装置 存储 介质 | ||
1.一种流式计算的增量持久化方法,其特征在于,所述流式计算由多个节点进行,所述方法包括:
获取当前节点的新增数据,并将所述新增数据根据操作类型分为多个数据单元,所述新增数据包括当前节点接收到上一节点发送的数据后,对该数据进行处理所产生的中间数据和结果数据;
将所述多个数据单元存入存储系统;以及
根据所述操作类型对存入所述存储系统的所述多个数据单元进行合并,以获得所述当前节点的持久化数据;
所述操作类型包括插入和删除,所述数据单元包括数据内容,所述根据所述操作类型对所述数据单元进行合并,以获得所述当前节点的持久化数据,包括:
将所述插入类型的数据单元与所述删除类型的数据单元进行比对,以获取数据内容相同的所述插入类型的数据单元与所述删除类型的数据单元;
将所述数据内容相同的所述插入类型的数据单元与所述删除类型的数据单元进行删除,以获得所述当前节点的持久化数据。
2.如权利要求1所述的方法,其特征在于,在所述获得所述当前节点的持久化数据之后,还包括:
根据所述当前节点的持久化数据,对所述当前节点的计算状态进行恢复。
3.如权利要求2所述的方法,其特征在于,所述新增数据包括当前节点的输出结果数据、当前节点的用户状态修改数据、定时器数据中的一种或者多种。
4.如权利要求3所述的方法,其特征在于,所述将所述多个数据单元存入存储系统,包括:
将所述多个数据单元打包为数据块;
根据预设的传输大小阈值和传输时间阈值将多个所述数据块打包为数据组;
将所述数据组存入所述存储系统中当前节点所对应的服务器。
5.如权利要求4所述的方法,其特征在于,所述将所述数据组存入所述存储系统中当前节点所对应的服务器,包括:
获取所述数据组中所述数据单元的数据标识;
根据所述数据标识将所述数据组存入当前节点所对应的服务器。
6.如权利要求2所述的方法,其特征在于,所述根据所述当前节点的持久化数据,对所述当前节点的计算状态进行恢复,包括:
判断当前节点是否存在异常;
若所述当前节点存在异常,则在所述存储系统中查找所述当前节点的持久化数据;
根据查找的所述当前节点的持久化数据,将所述当前节点的计算状态恢复正常。
7.如权利要求6所述的方法,其特征在于,所述当前节点的持久化数据包括当前节点的用户状态修改数据,定时器数据中的一种或者两种,在所述将所述当前节点的计算状态恢复正常之后,还包括:
获取所述当前节点的上一节点的输出结果数据;
根据所述当前节点的上一节点的输出结果数据,计算所述当前节点的输出结果数据;
在所述存储系统中删除上一节点的输出结果数据;以及
将所述当前节点的输出结果数据传输给下一节点。
8.如权利要求7所述的方法,其特征在于,所述获取所述当前节点的上一节点的输出结果数据,包括:
从所述上一节点获取所述上一节点的输出结果数据,或者
从所述存储系统中获取所述上一节点的输出结果数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811388343.4/1.html,转载请声明来源钻瓜专利网。