[发明专利]一种冗余代码的识别方法、装置和设备在审
申请号: | 202110439936.4 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113064597A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 夏雯君;李海波 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F8/41 | 分类号: | G06F8/41 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;王涛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 冗余 代码 识别 方法 装置 设备 | ||
本说明书实施例提供了一种冗余代码的识别方法、装置和设备,其中,该方法包括:获取目标源代码的执行计划信息集;确定所述执行计划信息集中各个执行计划片段的目标特征向量;基于所述各个执行计划片段的目标特征向量,利用聚类算法对所述各个执行计划片段进行相似度匹配,得到至少一组匹配成功的相似执行计划片段;获取所述相似执行计划片段的生产运维信息;根据所述生产运维信息,确定所述至少一组相似执行计划片段中的待调整冗余执行计划片段。在本说明书实施例中,在冗余代码识别过程中无需依赖手动操作,可以高效地实现大数据平台冗余高消耗逻辑的识别,有效提升了大数据平台自我调优的能力。
技术领域
本说明书实施例涉及大数据技术领域,特别涉及一种冗余代码的识别方法、装置和设备。
背景技术
随着数据的应用场景越来越多,各大企业也纷纷投入大数据平台的建设,然而在业务发展前期,为了快速实现业务,烟囱式的开发模式导致大数据平台上存在大量重复逻辑的代码,大大浪费了大数据平台的计算资源,如何将这些冗余重复又高消耗的逻辑识别出来,成为阻碍大数据平台发展的瓶颈问题。
现有技术中由于各个数据应用的割裂,需要运维人员重新梳理业务数据、重新设计数据模型、搭建数据中台、重写现有逻辑,使得项目周期长,无法及时地识别出冗余代码,以便对大数据平台进行调优。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书实施例提供了一种冗余代码的识别方法、装置和设备,以解决现有技术中无法及时地识别出冗余代码以对大数据平台进行调优的问题。
本说明书实施例提供了一种冗余代码的识别方法,包括:获取目标源代码的执行计划信息集;其中,所述执行计划信息集中包含所述目标源代码中各个结构化查询语句对应的至少一个执行计划片段;确定所述执行计划信息集中各个执行计划片段的目标特征向量;基于所述各个执行计划片段的目标特征向量,利用聚类算法对所述各个执行计划片段进行相似度匹配,得到至少一组匹配成功的相似执行计划片段;获取所述相似执行计划片段的生产运维信息;根据所述生产运维信息,确定所述至少一组相似执行计划片段中的待调整冗余执行计划片段。
本说明书实施例还提供了一种冗余代码的识别装置,包括:第一获取模块,用于获取目标源代码的执行计划信息集;其中,所述执行计划信息集中包含所述目标源代码中各个结构化查询语句对应的至少一个执行计划片段;第一确定模块,用于确定所述执行计划信息集中各个执行计划片段的目标特征向量;匹配模块,用于基于所述各个执行计划片段的目标特征向量,利用聚类算法对所述各个执行计划片段进行相似度匹配,得到至少一组匹配成功的相似执行计划片段;第二获取模块,用于获取所述相似执行计划片段的生产运维信息;第二确定模块,用于根据所述生产运维信息,确定所述至少一组相似执行计划片段中的待调整冗余执行计划片段。
本说明书实施例还提供了一种冗余代码的识别设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述冗余代码的识别方法的步骤。
本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述冗余代码的识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110439936.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:藻毒素降解酶及复合材料与应用
- 下一篇:一种屏蔽丝毛刷整形机