[发明专利]基于规则的大数据离线批处理性能容量扫描方法及装置在审
申请号: | 202110741372.X | 申请日: | 2021-06-30 |
公开(公告)号: | CN113419957A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 赵吉昆;张世瑛;梁晔华;王泽普 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F16/23;G06F16/242;G06F16/25;G06F8/41 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 赵平;董骁毅 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 规则 数据 离线 批处理 性能 容量 扫描 方法 装置 | ||
本申请实施例提供一种基于规则的大数据离线批处理性能容量扫描方法及装置,涉及大数据技术领域,也可用于金融领域,方法包括:根据预设间隔符对HQL脚本程序代码进行拆分,得到至少一个HQL语句;依次对所述HQL语句进行脚本解析,判断经过所述脚本解析后的HQL语句是否符合预设性能隐患语法规则,若符合,则将对应的HQL语句、HQL脚本程序代码以及性能隐患语法输出至设定汇总文件;本申请能够有效、准确和便捷得对HQL脚本的性能容量进行隐患排查。
技术领域
本申请涉及大数据技术领域,也可用于金融领域,具体涉及一种基于规则的大数据离线批处理性能容量扫描方法及装置。
背景技术
企业的大数据服务云平台为各类专业大数据分析应用提供数据接入、存储、计算、安全管理、资源管理等服务,随着平台构建的不断完善,其技术体系日益庞大,承载的业务功能日益丰富,在平台运维体系不断扩大的同时,各个应用场景的具体模型和逻辑在新技术架构下的性能表现逐渐成为产品研发流程关注的焦点之一。这也对“多应用、多租户”框架体系下的大数据平台的性能容量测试方法、工具提出了更高的要求。
发明人发现,现有技术中当接入大数据服务云的离线批处理业务系统达到一定数量(例如上百个)后,在每期基于大数据服务云的项目研发上线、迭代优化过程中,各开发人员需要通过hive sql(以下简称HQL)脚本对数据湖或数据仓库中的基础数据或主题数据进行业务逻辑加工等关联操作,由于编写HQL脚本的开发人员编码风格各异,同时对于HQL语法的掌握水平参差不齐,在各项目开发过程中会掺杂各种低效写法导致作业运行效率缓慢,同时消耗大数据分布式集群资源巨大,该类离线批处理脚本存在着较大优化空间。而对于复杂逻辑的HQL脚本实现或基于大表(TB级别)的基础数据关联HQL脚本实现则更需要注重性能隐患,因此,对HQL脚本中存在的低效写法进行校验排查并反馈整改的重要性不言而喻。
发明内容
针对现有技术中的问题,本申请提供一种基于规则的大数据离线批处理性能容量扫描方法及装置,能够有效、准确和便捷得对HQL脚本的性能容量进行隐患排查。
为了解决上述问题中的至少一个,本申请提供以下技术方案:
第一方面,本申请提供一种基于规则的大数据离线批处理性能容量扫描方法,包括:
根据预设间隔符对HQL脚本程序代码进行拆分,得到至少一个HQL语句;
依次对所述HQL语句进行脚本解析,判断经过所述脚本解析后的HQL语句是否符合预设性能隐患语法规则,若符合,则将对应的HQL语句、HQL脚本程序代码以及性能隐患语法输出至设定汇总文件。
进一步地,所述判断经过所述脚本解析后的HQL语句是否符合预设性能隐患语法规则,包括:
提取经过所述脚本解析后的HQL语句中的设定源表,并确定所述源表中的设定条件语句;
判断所述条件语句是否包含有分区限定字段,若无,则判定所述HQL语句符合预设全表扫描隐患语法规则,否则判定所述HQL语句正常。
进一步地,所述判断经过所述脚本解析后的HQL语句是否符合预设性能隐患语法规则,包括:
提取经过所述脚本解析后的HQL语句中的设定源表,并确定所述源表中的设定插入语句;
判断所述插入语句是否包含有分区限定字段,若无,则判定所述HQL语句符合预设全表插入隐患语法规则,否则判定所述HQL语句正常。
进一步地,所述判断经过所述脚本解析后的HQL语句是否符合预设性能隐患语法规则,包括:
判断经过所述脚本解析后的HQL语句中是否包含有设定查询语句、设定笛卡尔积查询语句、设定排序语句、设定统计语句以及设定记录插入函数中的任意一种,若是,则判定所述HQL语句符合预设性能隐患语法规则,否则判定所述HQL语句正常。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110741372.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置