[发明专利]一种自然语言与结构化查询语言的转换方法及装置有效

专利信息
申请号: 201910152421.9 申请日: 2019-02-28
公开(公告)号: CN109933602B 公开(公告)日: 2021-05-04
发明(设计)人: 朱斌;李宗鹏;周睿婷;黄浩 申请(专利权)人: 武汉大学
主分类号: G06F16/242 分类号: G06F16/242;G06F16/25
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 罗飞
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自然语言 结构 查询 语言 转换 方法 装置
【说明书】:

发明公开了一种自然语言与结构化查询语言的转换方法及装置,其中的方法首先将一个小规模的问题‑SQL对数据集中的SQL语句进行语法解析,变形为具有空间语义特征的广义树形编码和拓扑图编码;然后构建一个能够处理多种编码的机器翻译模型,来学习该数据集以及其变种;再根据已有的数据库表文件来生成语法上正确并且语义上有效的SQL,作为翻译模型的输入,得到自然语言形式的问题,达到了扩充数据集的目的;最后,使用流行的机器翻译模型学习扩充后的数据集,实现了性能的提升,且通过机器翻译模型可以实现自然语言与结构化查询语言的快速与准确转换。本发明可以实现提高转换效率和转换准确性的技术效果。

技术领域

本发明涉及然语言处理和数据库技术领域,具体涉及一种自然语言与结构化查询语言的转换方法及装置。

背景技术

在信息化时代的21世纪,生活中充斥着海量的信息,如果我们想要使用这些信息,必须先将其存储在数据库中。每当我们需要查看这些信息时,就通过结构化查询语言(Structured Query Language,以下简称SQL)去相应的数据库中查询。尽管SQL非常简洁、灵活,但是对于没有计算机专业背景的人来说,还是很难掌握并且熟练运用;尤其是在需要频繁地使用SQL语句的时候,复杂的数据库操作严重降低了他们的效率,他们亟需一种更加简单、快速的数据库交互方式。

当需要查询某种信息时,如果只需要用自然语言组织的问题来描述自己的需求,计算机系统能够快速地将问题转换为对应的SQL语句,进行数据库查询操作,即可得到所需的信息,这样可以大大降低用户查询信息的难度,提高了人机交互效率。现有技术中,实现该功能的主要方法就是通过神经网络学习问题和SQL数据对,得到一个收敛后的模型,再将用户提出的问题作为该模型的输入,再输出对应的SQL语句。

本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:

现有技术中,公开的数据集较少,且包含的数据量也不多,使得学习得到的模型表现不佳。

由此可知,现有技术中存在转换效率不高和结果不够准确的技术问题。

发明内容

为了解决现有技术中存在的转换效率不高和结果不够准确的技术问题,本发明提供了一种自然语言与结构化查询语言的转换方法及装置。首先根据已有的少量数据生成更多的数据,在保证数据质量的前提下,将数据量扩充到原来的几倍甚至几十倍,然后使用神经网络学习扩充后的数据集,得到一个理论上性能更优的模型,从而提高转换的准确性。

本发明第一方面提供了一种自然语言与结构化查询语言的转换方法,预先给定数数据库表文件集DBF和问题-SQL对数据集QS,所述方法包括:

步骤S1:采用神经网络学习问题-SQL对数据集QS,将SQL作为输入,问题作为输出,进行训练后,得到一个收敛后的模型SQL2QUE,其中,SQL2QUE用以将SQL转换为对应的问题;

步骤S2:根据DBF中的表字段信息,并基于SQL语法自定义规则建立一个SQL语句生成模型SQL-GEN,再根据SQL语句是否有效,生成SQL数据集SD,其中,SQL数据集SD中包含判定结果有效的SQL语句;

步骤S3:将SQL数据集SD中的SQL语句作为模型SQL2QUE的输入,获得对应的问题,然后将获得对应的问题添加至SQL数据集SD中,再将SD数据集中的SQL和对应QD数据集中的问题进行匹配,得到生成的数据集AQS,并将数据集AQS与数据集AQS进行合并,获得新的数据集NQS;

步骤S4:采用神经网络学习新的数据集NQS,将问题作为输入,SQL作为输出,进行训练后,得到一个收敛后的模型QUE2SQL,其中,模型QUE2SQL用以将问题转换为对应的SQL;

步骤S5:将待转换的问题作为模型QUE2SQL的输入,转换获得对应的结构化查询语言SQL。

在一种实施方式中,步骤S1具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910152421.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top