[发明专利]SQL语句生成方法、装置、设备及存储介质在审
申请号: | 201911103357.1 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110909018A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 陈瑞钦;黄启军;李诗琦;唐兴兴;林冰垠 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 徐进之 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | sql 语句 生成 方法 装置 设备 存储 介质 | ||
本发明涉及金融科技领域,本发明公开了一种SQL语句生成方法、装置、设备及存储介质,所述SQL语句生成方法包括:获取各特征分箱规则,并根据预设的分箱规则库对各特征分箱规则进行分析处理,以获得各特征分箱规则的特征类型;根据各特征类型获取各所述特征分箱规则对应的目标语法匹配规则;基于各所述特征分箱规则以及所述各特征分箱规则对应的目标语法匹配规则,生成所述各特征分箱规则对应的SQL语句。本发明实现了特征分箱模型自动转化为SQL语句地系统,减少输出模型到生产环境中运行的人力成本和时间成本,提升SQL语句的生成效率。
技术领域
本发明涉及金融科技技术领域,尤其涉及一种SQL语句生成方法、装置、设备及存储介质。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融工业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
特征分箱是将区间型特征值分为多个离散值或将离散型特征值进行分组整理的一种特征处理方法,能使特征值较为稳定,提升模型的鲁棒性。特征分箱算法广泛的应用于各类场景建模,建模人员建立分箱模型后,需要按照分箱规则编写SQL代码并交由数据库管理员部署到生产环境运行。
但是,当前手工编写SQL代码的方式效率低、错误率高,尤其当用户需要频繁进行交互式分箱调整时,分箱规则将会高频迭代更新,导致手工SQL压力过大。同时特征分箱一般涉及到大量特征处理,每个特征分箱数量数十到上百,使得特征分箱规则数量非常庞大,导致采用人工编写SQL语句成本过高。
发明内容
本发明的主要目的在于提供一种SQL语句生成方法、装置、设备及存储介质,旨在实现将特征分箱模型自动转化为SQL语句,减少输出模型到生产环境中运行的人力成本和时间成本,提升SQL语句的生成效率。
为实现上述目的,本发明实施例提供一种SQL语句生成方法,所述SQL语句生成方法包括:
获取各特征分箱规则,并根据预设的分箱规则库对各特征分箱规则进行分析处理,以获得各特征分箱规则的特征类型;
根据各特征类型获取各所述特征分箱规则对应的目标语法匹配规则;
基于各所述特征分箱规则以及所述各特征分箱规则对应的目标语法匹配规则,生成所述各特征分箱规则对应的SQL语句。
可选地,所述根据预设的分箱规则库对各特征分箱规则进行分析处理,以获得各特征分箱规则的特征类型,包括:
根据预设的分箱规则库对各特征分箱规则进行分析处理,以获得各特征分箱规则的特征属性;
若所述特征属性为有限划分属性,则所述特征分箱规则的特征类型为列名型;
若所述特征属性为范围划分属性,则所述特征分箱规则的特征类型为区间型。
可选地,所述根据预设的分箱规则库对各特征分箱规则进行分析处理,以获得各特征分箱规则的特征属性之后,还包括:
若所述特征属性为缺失值属性,则将所述特征分箱规则丢弃不作处理。
可选地,所述特征类型为列名型、区间型的一种,所述根据各特征类型获取各所述特征分箱规则对应的目标语法匹配规则,包括:
若特征类型为列名型,则获取对应特征分箱规则的目标语法匹配规则为列名型语法匹配规则;
若特征类型为区间型,则获取对应特征分箱规则的目标语法匹配规则为区间型语法匹配规则。
可选地,所述基于各所述特征分箱规则以及所述各特征分箱规则对应的目标语法匹配规则,生成所述各特征分箱规则对应的SQL语句之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911103357.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种融入区块链技术的医疗数据安全存储方法
- 下一篇:一种往复筛