[发明专利]文本转SQL模型的优化方法及系统在审

专利信息
申请号: 202110476255.5 申请日: 2021-04-29
公开(公告)号: CN113177123A 公开(公告)日: 2021-07-27
发明(设计)人: 俞凯;曹瑞升;陈露 申请(专利权)人: 思必驰科技股份有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/242;G06F40/151;G06F40/211;G06F40/284;G06F40/30;G06N3/04;G06N3/08
代理公司: 北京商专永信知识产权代理事务所(普通合伙) 11400 代理人: 黄谦;车江华
地址: 215123 江苏省苏州市苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 sql 模型 优化 方法 系统
【说明书】:

发明实施例提供一种文本转SQL模型的优化方法。该方法包括:将从文本的异构图以及异构图对应的线图中确定的关系特征输入至隐藏层;在隐藏层中,通过两个关系图注意力网络分别对节点特征和边特征迭代更新,将迭代更新后的节点特征输入至输出层;在输出层中确定对应的SQL。本发明实施例还提供一种文本转SQL模型的优化系统。本发明实施例在异构图的编码任务中,通过引入异构图的线图结构,丰富语义特征,对边之间的拓扑结构进行建模,进一步提升对异构图的编码能力,同时对节点和边双向建模,使得在面对复杂的连接情况时提升性能。

技术领域

本发明涉及智能语音领域,尤其涉及一种文本转SQL模型的优化方法及系统。

背景技术

文本转SQL的任务旨在给定相应的数据库模式的情况下将自然语言问题转换为相应的SQL查询语句。

为了实现文本转SQL任务,通常会使用SQLNet,TypeSQL,GNNSQL,EditSQL和RATSQL等文本转SQL的模型。

这些模型都旨在将输入的自然语言文本和数据库模式一起进行联合编码,然后通过端到端的方式转化成目标输出SQL程序。数据库模式包括数据库中每一个数据表的名称、表中每一列的名称、数据表的主键的集合和数据表之间的外键连接信息。数据库中的表和列统称为模式条目(schema items),它们根据从属关系、主键、外键可以构成数据库的模式图(schema graph)。根据不同模型的编码方式,可以细分为:

(1)SQLNet在联合编码时以问句作为上下文,计算每一个模式条目的上下文向量来加强对数据库模式的编码。

(2)TypeSQL进一步地考虑每一个输入单词(包括问句和模式条目)的类型信息,比如整数、浮点数、布尔类型等,对于问句里的单词,还考虑是否和某一个模式条目在字符串形式上匹配,称之为模式链接(schema linking)。这些类型和匹配信息作为额外的输入特征向量来加强联合编码。

(3)GNNSQL考虑模式图的图连接信息,利用一个关系图卷积神经网络来加强数据库模式的编码。

(4)EditSQL在SQLNet的基础之上,进一步地以数据库模式作为上下文,计算问句中每一个单词的上下文向量,即考虑问句和模式条目之间的双向注意力。

(5)RATSQL借用机器翻译中相对位置编码的方法,对图注意力网络进行修改,考虑了不同类型的节点之间(问句、表、列)的不同关系。

在实现本发明过程中,发明人发现相关技术中至少存在如下问题:

SQLNet和EditSQL方法都只对节点的特征表示进行建模,在计算注意力时完全忽略了对节点之间关系的建模,即忽略了不同类型的边特征。

GNNSQL方法只考虑了数据库模式之间的图连接信息,没有考虑问句和数据库模式之间的语义关联信息。

TypeSQL和RATSQL方法一方面没有考虑边与边之间的结构信息,即缺少对有效元路径(meta-path)的挖掘;另一方面没有对局部和全局的关系进行区分,只是单纯地利用一个全连接图。

发明内容

为了至少解决现有技术中这些方法都忽视了有向图中边与边之间的连接信息,要么只考虑了局部的关系,要么利用一个全连接图仅考虑全局关系,忽视了对局部关系的强调的问题。

第一方面,本发明实施例提供一种文本转SQL模型的优化方法,包括:

将从文本的异构图以及所述异构图对应的线图中确定的关系特征输入至隐藏层,其中,所述关系特征至少包括:所述异构图确定的节点特征以及所述线图确定的边特征,以提升所述关系特征的语义;

在所述隐藏层中,通过两个关系图注意力网络分别对所述节点特征和所述边特征迭代更新,将迭代更新后的节点特征输入至输出层;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110476255.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top