[发明专利]一种数据查询方法及装置有效
申请号: | 202210058343.8 | 申请日: | 2022-01-19 |
公开(公告)号: | CN114090627B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 田有朋;李俊;刘海波;朱文嘉;黄亚东;王小卫 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/242;G06F16/22 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 查询 方法 装置 | ||
本说明书实施例提供了一种数据查询方法及装置,该方法包括:获取用于对数据存储系统进行数据查询的第一语句,第一语句基于自然语言;确定第一语句的自然语义,自然语义包括数据查询依据的查询条件、以及对于所述数据查询旨在获取的目标数据项的描述;基于自然语义,生成查询逻辑树,查询逻辑树指示依据查询条件,得到目标数据项的中间逻辑步骤,且,中间逻辑步骤与数据存储结构无关;根据查询逻辑树,生成基于数据查询语言的第二语句。
技术领域
本说明书一个或多个实施例涉及自然语言处理领域和数据分析领域,尤其涉及一种数据查询方法及装置。
背景技术
自然语言查询是根据自然语言进行数的数据查询。自然语言查询降低数据查询作业的技术门槛,使得操作人员无需掌握专业的数据查询语言既可以方便的进行数据查询。尤其,例如在企业中掌握数据查询语言的专业技术人员数量不足,或数据查询需求量巨大的场景中,帮助企业因以上原因造成的可进行数据查询作业量的瓶颈,提高企业数据查询的效率。但是,现有的利用自然语言的数据查询方法,仍然存在查询准确率仍较低、对于复杂查询作业的支持能力不足的问题。
因此,需要一种更好的数据查询方法。
发明内容
本说明书中的实施例旨在提供一种新的数据查询方法。该方法将自然语言形式的自然查询语句,生成表达查询逻辑、且与数据具体存储方式无关的查询逻辑树,然后根据查询逻辑树生成基于数据查询语言的查询执行语句。利用该方法,可以大大提供自然查询语句到查询执行语句之间的转换难度,提高两者之间的转换质量,进而大大提高根据自然语言的查询结果的准确率,以及提高对于依据自然语言的复杂查询作业的支持能力。
根据第一方面,提供了一种数据查询方法,包括:
获取用于对数据存储系统进行数据查询的第一语句,所述第一语句基于自然语言;
确定所述第一语句的自然语义,所述自然语义包括所述数据查询依据的查询条件、以及对于所述数据查询旨在获取的目标数据项的描述;
基于所述自然语义,生成查询逻辑树,所述查询逻辑树指示依据所述查询条件,得到所述目标数据项的中间逻辑步骤,且,所述中间逻辑步骤与数据存储结构无关;
根据所述查询逻辑树,生成基于数据查询语言的第二语句。
在一种可能的实施方式中,确定所述第一语句的自然语义,包括:
基于对所述第一语句的语法分析和语义分析,生成第一语句的自然语义树;
基于所述自然语义,生成查询逻辑树,包括:
根据所述自然语义树,生成查询逻辑树。
在一种可能的实施方式中,生成基于数据查询语言的第二语句,包括:
根据所述查询逻辑树、以及数据存储系统的数据存储结构,生成第二语句。
在一种可能的实施方式中,所述包括数据存储结构包括,数据存储系统的数据表结构以及数据表之间的关系。
在一种可能的实施方式中,所述数据查询语言包括SQL语言、SPARK数据查询语言中的一种。
在一种可能的实施方式中,所述基于所述自然语义,生成查询逻辑树,包括:
基于所述查询条件和目标数据项,以及预先定义的逻辑节点,生成查询逻辑树。
在一种可能的实施方式中,所述逻辑节点,包括查询节点、筛选条件节点、查询数据项节点,其中,所述筛选条件节点、查询数据项节点作为查询节点的子节点;
基于所述查询条件和目标数据项,以及预先定义的逻辑节点,生成查询逻辑树,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210058343.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置