[发明专利]结构化查询语句生成系统及方法有效
申请号: | 201510054595.3 | 申请日: | 2015-01-30 |
公开(公告)号: | CN104657440B | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 欧阳江 | 申请(专利权)人: | 欧阳江 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 万振雄;刘耿 |
地址: | 510630 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结构 查询 语句 生成 系统 方法 | ||
一种结构化查询语句生成方法,包括:获取自然语言查询语句;利用预设的词典及第一规则,对所述自然语言查询语句进行切词,并得到切词方案;利用预设的第二规则,在所述切词方案上生成解析树;根据所述解析树的根节点生成局部查询参数,及代入所述解析树第一层子节点的全局查询参数并得到所述解析树的根节点的全局查询参数;及根据所述解析树的根节点的全局查询参数生成结构化查询语句。本发明还提供一种结构化查询语句生成系统。利用本发明可自动将自然语言查询语句转换成结构化查询语句。
技术领域
本发明涉及检索技术,尤其涉及一种结构化查询语句生成系统及方法。
背景技术
随着互联网技术的发展,用户对精准查询的要求越来越高。传统的搜索引擎只能机械地对用户输入的查询语句进行切词处理,并不能真正理解用户的意图和要求,返回的查询结果偏差很大,在应用至手机上时尤其影响用户体验。并且,无论是企业还是网站,有大量数据是存放在关系数据库中的,这些数据通常不会直接在网页上发布,所以不能为搜索引擎所访问,因此,这些数据也根本不会在查询结果中出现。
此外,在大数据时代,也面临着人机交互问题:在众多数据源的背景下,如何为用户提供一种简洁的查询手段而不是复杂的菜单系统;在大数据背景下,对数据进行各种统计、挖掘分析的结果,如何能被用户很容易地访问到。
因此,允许用户直接使用自然语言提出检索要求,由计算机系统在理解用户输入的基础上,自动完成有关检索,返回符合用户要求的精准的检索结果,是一个对数据检索进行优化的解决方案。
目前,实现上述解决方案的过程是,获取用户输入的自然语言查询语句;根据用户输入的自然语言查询语句生成结构化查询语句,通过结构化查询语句查询或搜索得到与自然语言查询语句对应的查询结果。
目前常有的生成结构化查询语句的方法是:获取用户输入的自然语言查询语句;将自然语言查询语句与查询模板进行四配,得到与自然语言查询语句匹配的查询模板;根据与自然语言查询语句匹配的查询模板,得到结构化查询语句。
然而,如上文所述的生成结构化查询语句的方法,需要事先由人工配置查询模板,为每个查询模板编写结构化查询语句,因此至少存在以下问题:1)人工配置查询模板、编写结构化查询语句的代价非常高昂,且效率低下;2)不同的用户可能会采用不同的表达方式来表达自然语言查询语句,这样会使查询模板无法被正确匹配,影响匹配的准确性;3)当自然语言查询语句是嵌套的问句时,查询模板无法进行匹配,导致语义损失,无法满足大规模工业化应用的要求。
发明内容
鉴于以上内容,有必要提供一种结构化查询语句生成系统及方法,可根据用户输入的自然语言进行语义分析,继而生成相应的结构化查询语句,无需通过人工编制查询模板,更无需进行模板匹配。
进一步地,还有必要提供一种结构化查询语句生成系统及方法,可自动识别语义相同但表达形式不同的查询语句,从而确保返回的检索结果不受语言习惯的偏差的影响。
此外,还有必要提供一种结构化查询语句生成系统及方法,可处理复杂嵌套的查询,确保在不损失语义的条件下生成相应的复合查询语句。
一种结构化查询语句生成方法,应用于电子装置,该方法包括:获取自然语言查询语句;利用预设的词典及第一规则,对所述自然语言查询语句进行切词,并得到切词方案;利用预设的第二规则,在所述切词方案上生成解析树;根据所述解析树的根节点生成局部查询参数,及代入所述解析树第一层子节点的全局查询参数并得到所述解析树的根节点的全局查询参数;及根据所述解析树的根节点的全局查询参数生成结构化查询语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于欧阳江,未经欧阳江许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510054595.3/2.html,转载请声明来源钻瓜专利网。