[发明专利]数据库查询结果生成方法、装置、设备及存储介质在审
申请号: | 202210489889.9 | 申请日: | 2022-05-07 |
公开(公告)号: | CN115062050A | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 帖军;范子琪;孙翀;覃俊;毛腾跃;郑禄;夏梦;王子珊 | 申请(专利权)人: | 中南民族大学 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F16/242 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 吴士卿 |
地址: | 430000 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 查询 结果 生成 方法 装置 设备 存储 介质 | ||
本发明属于计算机技术领域,公开了一种数据库查询结果生成方法、装置、设备及存储介质。本发明通过在接收到自然语言问题时,获取目标数据库的模式信息及位置信息代码,目标数据库为预先进行过逆规范化处理的数据库;对自然语言问题、模式信息及位置信息代码进行编码处理,生成语句编码向量及表编码向量;根据语句编码向量及表编码向量生成数据库查询语句;根据数据库查询语句对目标数据库进行数据查询,生成查询结果。由于预先对数据库进行逆规范化处理,减少了连接操作的需求与表的数量,简化了生成查询语句的复杂度,然后根据编码生成的数据库查询语句即可对数据库进行查询,从而实现了依据自然语言对数据库进行查询。
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据库查询结果生成方法、装置、设备及存储介质。
背景技术
现有技术中,研究点或围绕着提升编码中自然语言到语义向量的语义优化,如利用BERT、Transformer、Dense-with-CNN等网络来改进编码模块中自然语言语义的编码;研究点或围绕着解码方式,对SQL语句语法正确与结构正确做出改进,如利用抽象语法树精进语法结构、如使用槽填充解码器界定语法、如使用图神经网络提高语法结构争取性;对于SQL语句中多表连接问题鲜有研究,多表连接查询是数据分析领域重要的查询类型之一,连接查询的实现代价很高,从而影响了大数据分析结果的时效性,多表连接的JOIN路径问题也是一项难题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种数据库查询结果生成方法、装置、设备及存储介质,旨在解决现有技术无法依据自然语言对数据库进行查询的技术问题。
为实现上述目的,本发明提供了一种数据库查询结果生成方法,所述方法包括以下步骤:
在接收到自然语言问题时,获取目标数据库的模式信息及位置信息代码,所述目标数据库为预先进行过逆规范化处理的数据库;
对所述自然语言问题、所述模式信息及所述位置信息代码进行编码处理,生成语句编码向量及表编码向量;
根据所述语句编码向量及所述表编码向量生成数据库查询语句;
根据所述数据库查询语句对所述目标数据库进行数据查询,生成查询结果。
可选的,所述在接收到自然语言问题时,获取目标数据库的模式信息及位置信息代码,所述目标数据库为预先进行过逆规范化处理的数据库的步骤之前,还包括:
获取待处理数据库中各数据表的表信息;
根据所述表信息确定各数据表之间的连接关系;
根据所述连接关系对所述待处理数据库进行逆规范化处理,获得目标数据库。
可选的,所述根据所述连接关系对所述待处理数据库进行逆规范化处理,获得目标数据库的步骤,包括:
根据所述连接关系将所述待处理数据库中的数据表分为至少一个区块;
对各区块中的数据表进行逆规范化处理,获得各区块对应的逆规范化表;
将各区块对应的逆规范化表进行全外连接,并根据全外连接的结果构建目标数据库。
可选的,所述对所述自然语言问题、所述模式信息及所述位置信息代码进行编码处理,生成语句编码向量及表编码向量的步骤,包括:
对所述位置信息代码进行池化处理,获得位置语义向量;
对所述自然语言问题进行语义提取,获得问题编码向量;
对所述模式信息进行编码,生成模式编码向量,并对所述模式信息中包含的表列名进行编码,获得列向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学,未经中南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210489889.9/2.html,转载请声明来源钻瓜专利网。