[发明专利]一种数据库操作方法及装置在审

专利信息
申请号: 202110100847.7 申请日: 2021-01-26
公开(公告)号: CN112783921A 公开(公告)日: 2021-05-11
发明(设计)人: 王阳;邱雪涛;王宇 申请(专利权)人: 中国银联股份有限公司
主分类号: G06F16/2452 分类号: G06F16/2452;G06N20/00
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 宋正伟
地址: 200135 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据库 操作方法 装置
【说明书】:

发明公开了一种数据库操作方法及装置,其中方法为:获取目标自然语言文本;将所述目标自然语言文本输入至基于自然语言向结构化查询语言转化NL2SQL的预测模型,获得所述目标自然语言文本的目标结构化查询语言SQL语句;所述目标SQL语句的数据结构为预设数据结构;所述预设数据结构包括各部分;所述各部分与SQL语句的预设格式的各语句片段对应;所述预测模型是基于目标数据集按照机器学习训练得到的;其中,所述目标数据集任一训练数据包括:自然语言文本以及所述自然语言文本对应的SQL语句,所述SQL语句的数据结构为所述预设数据结构;通过执行所述目标SQL语句,操作目标数据库。

技术领域

本发明涉及数据库技术领域,尤其涉及一种数据库操作方法及装置。

背景技术

在日常生活中用户经常和数据库进行交互,比如网络购物、订票、订餐等。但目前的数据库交互方式还有着诸多问题,一般通过结构化查询语言(Structured QueryLanguage,SQL)来操作数据库。但是对于不具备数据库专业知识的用户,却是很大的挑战。目前的方式中,基于条件筛选的专门界面,用户可以通过点选不同的条件来对数据库进行操作,但在这个界面上操作会受限于预先设好的SQL模板,仅能得到个别SQL语句,不具备灵活性。

现有技术中,一种更友好的方式是自然语言向结构化查询语言转化(NaturalLanguage to SQL,NL2SQL),即使用自然语言处理技术,将用户的自然语言表达转化成SQL语句,直接对数据库查询并返回结果。然而,目前的NL2SQL仅支持较为简单的应用场景,如数据集的数据形式和设计过于简单,对于SQL语句,不能选择多个列,也不能处理多个查询条件。这就意味着目前的NL2SQL仅能转化得到一部分较简单的SQL语句,仅支持一些较简单的应用场景,只能对数据库执行较简单的操作。

发明内容

本发明提供一种数据库操作方法及装置,解决了现有技术中NL2SQL仅支持一些较简单的应用场景的问题。

第一方面,本发明提供一种数据库操作方法,包括:

获取目标自然语言文本;

将所述目标自然语言文本输入至基于自然语言向结构化查询语言转化NL2SQL的预测模型,获得所述目标自然语言文本的目标结构化查询语言SQL语句;

所述目标SQL语句的数据结构为预设数据结构;所述预设数据结构包括各部分;所述各部分与SQL语句的预设格式的各语句片段对应;

所述预测模型是基于目标数据集按照机器学习训练得到的;其中,所述目标数据集任一训练数据包括:自然语言文本以及所述自然语言文本对应的SQL语句,所述SQL语句的数据结构为所述预设数据结构;

通过执行所述目标SQL语句,操作目标数据库。

上述方法中,由于数据库操作语句的数据结构为预设数据结构,所述预设数据结构细化了SQL语句可能出现的各部分,所述各部分与SQL语句的预设格式的各语句片段对应,所以囊括了SQL语句可能出现的各种情况,而在训练预测模型时,目标数据集每条训练数据中的SQL语句的数据结构也是预设数据结构,那么在目标数据集进行训练时,也学习到了各SQL语句各种情况的知识,使得预测模型可以识别更多复杂的场景,因此,获取目标自然语言文本后,即便目标自然语言文本对应较为复杂的场景,那么也可以转换为相应的SQL语句,从而对数据库实现较复杂的操作。

可选的,所述预测模型按照以下方式训练得到:

基于所述目标数据集中各训练数据的自然语言文本的第一类数据以及所述自然语言文本对应的SQL语句,对初始模型进行机器学习训练,得到中间模型;任一训练数据的第一类数据为所述训练数据中按照预设规则选择的数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110100847.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top