[发明专利]数据处理方法和流计算系统有效
申请号: | 201510246697.5 | 申请日: | 2015-05-14 |
公开(公告)号: | CN106294357B | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 李妹芳;魏蒲萌;段培乐;李闪 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/17;G06F21/53 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提出一种数据处理方法和流计算系统,该数据处理方法包括数据接收模块接收到要处理的数据后,将所述数据写入文件系统中,并在所述数据被写入文件系统后,发送所述数据给逻辑处理模块;逻辑处理模块根据对数据的接收情况获取有效数据,并且,定期对预设的检查点进行更新;以及,在发生失效转移时,确定最新的检查点,获取与所述最新的检查点对应的有效数据,并恢复所述有效数据。该方法能够满足对外服务化的诉求,以及在发生失效转移时避免数据源头重发。 | ||
搜索关键词: | 数据处理 方法 计算 系统 | ||
【主权项】:
1.一种数据处理方法,其特征在于,包括:数据接收模块接收到要处理的数据后,将所述数据写入文件系统中,并在所述数据被写入文件系统后,发送所述数据给逻辑处理模块;逻辑处理模块根据对数据的接收情况获取有效数据,其中,所述根据对数据的接收情况获取有效数据,包括:判断是否发生数据丢失和数据重复中的至少一项;如果未发生数据丢失和数据重复中的任一项,则将接收的未丢失且不重复的数据,确定为有效数据;如果发生数据丢失和数据重复中的至少一项,则对应执行如下项中的至少一项,并将处理后的数据确定为有效数据:如果发生数据丢失,则确定丢失的版本号,并从所述文件系统中补入所述丢失的版本号对应的数据;如果发生数据重复,则去掉重复的数据;并且所述逻辑处理模块定期对预设的检查点进行更新;以及,在发生失效转移时,确定最新的检查点,获取与所述最新的检查点对应的有效数据,并恢复所述有效数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510246697.5/,转载请声明来源钻瓜专利网。
- 上一篇:基于动态聚类的微博时间线生成方法及装置
- 下一篇:一种信息的检索方法及系统