[发明专利]基于Spark Streaming的数据处理方法、装置、计算机设备及存储介质有效
申请号: | 201911213201.9 | 申请日: | 2019-12-02 |
公开(公告)号: | CN110908788B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 陶劲;程强;万月亮;冯宇波 | 申请(专利权)人: | 北京锐安科技有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F16/182 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100044 北京市海淀区西小口*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种基于Spark Streaming的数据处理方法、装置、计算机设备及存储介质。该方法包括:获取当前批次的至少两个第一待执行任务,并合并为第二待执行任务,其中,第一待执行任务封装在弹性分布式数据集RDD中;执行第二待执行任务并将执行结果数据存储至分布式文件系统。本发明实施例所提供的技术方案,解决了由于NameNode的处理请求能力下降而导致的Spark Streaming进行数据处理时吞吐量下降的问题,减少了任务生成的文件数,即减少了向NameNode发出的请求数量,进而提高了NameNode处理请求能力的稳定性,从而提高了Spark Streaming数据处理时的吞吐量。 | ||
搜索关键词: | 基于 spark streaming 数据处理 方法 装置 计算机 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911213201.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种靛红芳烃共聚物、制备方法及应用
- 下一篇:一种水轮机转动轴故障监测方法