[发明专利]基于Spark SQL的数据处理方法及装置、存储介质及计算设备在审

申请号：	201811214789.5	申请日：	2018-10-18
公开（公告）号：	CN109408537A	公开（公告）日：	2019-03-01
发明（设计）人：	姚琴	申请（专利权）人：	网易（杭州）网络有限公司
主分类号：	G06F16/2453	分类号：	G06F16/2453;G06F16/2455
代理公司：	北京汉昊知识产权代理事务所(普通合伙) 11370	代理人：	朱海波
地址：	310052 浙江省杭州***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	上下文变量数据处理会话租户存储介质代理用户计算设备预设关系数据处理装置运行时环境实例化服务器查找响应创建应用服务
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于Spark SQL的数据处理方法，其特征在于包括：

响应于会话的发起，根据发起所述会话的代理用户的用户名，在预设关系集中查找所述用户名对应的Spark上下文变量实例；

若未查找到所述用户名对应的所述Spark上下文变量实例，则新建与所述用户名对应的Spark上下文变量，并对所述Spark上下文变量进行实例化，以形成所述用户名对应的Spark上下文变量实例，并在所述预设关系集中添加所述用户名至少与对应的Spark上下文变量实例之间的对应关系；以及

根据发起所述会话的代理用户的用户名对应的Spark上下文变量实例，创建对应的运行时环境来执行对应的数据处理。

2.根据权利要求1所述的数据处理方法，其特征在于，所述预设关系集包括：从由一个或多个代理用户的用户名构成的第一集合到由一个或多个Spark上下文变量实例的相关信息构成的第二集合之间的一一映射关系。

3.根据权利要求1所述的数据处理方法，其特征在于，所述预设关系集包括：从由一个或多个代理用户的用户名构成的第一集合到第三集合之间的一一映射关系；

其中，所述第三集合包括一个或多个元素，所述第三集合的每个元素包括一个Spark上下文变量实例的相关信息以及与该Spark上下文变量实例相应的连接数。

4.根据权利要求1-3中任一项所述的数据处理方法，其特征在于还包括：

周期性地、或响应于所述会话的关闭，根据LRU原理对Spark上下文变量实例所占用的资源进行回收。

5.根据权利要求1-3中任一项所述的数据处理方法，其特征在于，由同一代理用户在不同客户端发起的会话共享同一个Spark上下文变量实例。

6.根据权利要求1-3中任一项所述的数据处理方法，其特征在于，在查找发起所述会话的代理用户的用户名对应的Spark上下文变量实例的步骤之前，还包括：若发起所述会话的代理用户的认证信息无效，结束所述会话的处理。

7.根据权利要求1-3中任一项所述的数据处理方法，其特征在于，在查找发起所述会话的代理用户的用户名对应的Spark上下文变量实例的步骤之前，还包括：若发起所述会话的代理用户不是启动所述服务器的进程用户的授信者，结束对所述会话的处理。

8.基于Spark SQL的数据处理装置，其特征在于包括：

查找单元，适于响应于会话的发起，根据发起所述会话的代理用户的用户名，在预设关系集中查找所述用户名对应的Spark上下文变量实例；

处理单元，适于若未查找到所述用户名对应的所述Spark上下文变量实例，则新建与所述用户名对应的Spark上下文变量，并对所述Spark上下文变量进行实例化，以形成所述用户名对应的Spark上下文变量实例，并在所述预设关系集中添加所述用户名至少与对应的Spark上下文变量实例之间的对应关系；以及

执行单元，适于根据发起所述会话的代理用户的用户名对应的Spark上下文变量实例，创建对应的运行时环境来执行对应的数据处理。

9.一种存储有程序的存储介质，所述程序被处理器执行时实现如权利要求1到7中的任一项所述的基于Spark SQL的数据处理方法。

10.一种计算设备，包括如权利要求9所述的存储介质。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于网易（杭州）网络有限公司，未经网易（杭州）网络有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811214789.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载