[发明专利]一种表达式检索转换为Elasticsearch搜索语句的方法及系统在审
申请号: | 202210211874.6 | 申请日: | 2022-03-04 |
公开(公告)号: | CN114691825A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 周明星;李通政;姜涛;闫湘洲;于敬;陈运文;纪达麒 | 申请(专利权)人: | 达而观信息科技(上海)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 上海智力专利商标事务所(普通合伙) 31105 | 代理人: | 周涛 |
地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表达式 检索 转换 elasticsearch 搜索 语句 方法 系统 | ||
本发明涉及到一种表达式检索转换为Elasticsearch搜索语句的方法,所述表达式检索所用的检索表达式由检索词和逻辑运算符组成,提交检索表达式至检索系统,由检索系统将检索表达式解析为搜索引擎能够识别和执行的检索命令式,再提交给开源搜索引擎Elasticsearch,获得想要的检索结果,该方法具体包括设计表达式和设计转换算法两个环节,在所述的设计表达环节中,列举出所使用的字段,分别定义简单检索式符号、检索式结合符和检索表达式符号的优先级;在设计转换算法环节中,将检索表达式转换为后缀表达式操作和运算检索式后缀表达式,获得转换完的Elasticsearch搜索语句。本发明的方法提高了检索系统的表达式解析能力,能够支持复杂程度的表达式,配合检索策略的制定和成功。
技术领域
本发明涉及到搜索引擎领域,特别涉及到一种表达式检索转换为Elasticsearch搜索语句的方法及系统。
背景技术
数据的爆发增长,对搜索提出了更多的需求。在众多要求中,搜索响应快、结果精准是最基础也最为关心的要求。在快方面,有众多的底层搜索引擎提供了良好的解决方案,其中开源的Solr和Elasticsearch,为搜索领域做出了重要贡献。大多数情况下,在将快的要求交给开源引擎后,另一被关注的是如何更好利用搜索引擎来获取更为准确的结果。一方面,结合机器学习方法,更好的理解用户的搜索关键字,学习关键字、用户习惯与待搜索文档之前的相关性;另一方面,复杂的布尔检索及表达式检索被沿用在特殊的行业文本检索(研报检索等),以弥补目前机器学习所不能完全理解的长文本检索。
表达式检索一般由检索词和各种逻辑运算符组成,它使用运算符结合检索系统规定的各种检索式子,组合成类似数据公式的复杂式子。提交给检索系统,检索系统将表达式解析成搜索引擎能够识别和执行的检索命令式,然后提交给搜索引擎,获取想要的检索结果。检索系统的表达式解析能力及方式、决定了能支持的表达式的复杂层度,直接影响检索策略的成败。
发明内容
本发明的目的在于克服现有技术中无法进行复杂程度检索和解析能力低的不足,提供一种表达式检索转换为Elasticsearch搜索语句的方法。本发明的方法提高了检索系统的表达式解析能力,能够支持复杂程度的表达式,配合检索策略的制定和成功。
为了达到上述发明目的,本发明提供的技术方案如下:
一种表达式检索转换为Elasticsearch搜索语句的方法,其特征在于,所述表达式检索所用的检索表达式由检索词和逻辑运算符组成,提交检索表达式至检索系统,由检索系统将检索表达式解析为搜索引擎能够识别和执行的检索命令式,再提交给开源搜索引擎Elasticsearch,获得想要的检索结果,该方法具体包括设计表达式和设计转换算法两个环节,在所述的设计表达环节中,列举出所使用的字段,分别定义简单检索式符号、检索式结合符和检索表达式符号的优先级;
在设计转换算法环节中,包括有:
第一步,将检索表达式转换为后缀表达式,其实现包括有:
S11.开始操作,查看表达式,并将表达式转化为表达式元素列表;
S12.取下一个元素;
S13.判断是否为简单检索式,若是则加入后缀表达式,执行s17步骤,若否则执行S14步;
S14.判断是否为检索式结合符,若否则输出错误提示,若是则执行S15步;
S15.区分字符,查看为左括号、右括号还是其他结合符;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达而观信息科技(上海)有限公司,未经达而观信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210211874.6/2.html,转载请声明来源钻瓜专利网。