[发明专利]一种基于solr的信息检索的方法以及装置有效
申请号: | 201711164079.1 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107943922B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 谢永恒;孟宪奎;火一莽;万月亮 | 申请(专利权)人: | 北京锐安科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22;G06F16/31 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100044 北京市海淀区西小口*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 solr 信息 检索 方法 以及 装置 | ||
1.一种基于solr的信息检索的方法,其特征在于,所述方法包括:
接收信息检索的请求,并获取所述请求中的参数,解析并识别所述参数;
启动分布式查询控制,并根据触发条件启动行打断控制或者查询超时控制;
采用段文件逆向加载和倒排表逆向加载的方式加载数据,执行自定义标准评分,并响应所述请求;
所述段文件逆向加载,包括:
采用横向分表进行数据横向的物理隔离,同时,按照数据写入数据、读取数据,采用加载最新表的数据并依据数据读取打断进行数据查询;
在solr的内部缺省处理控制逻辑中,采用从小到大的顺序进行段文件加载,并通过扩展solr缺省实现接口,完成从大到小的顺序加载段文件。
2.根据权利要求1所述的方法,其特征在于,所述分布式查询控制,包括:
在索引写入中,采用哈希方式将数据均匀分配到表的各个分片上;
在时间维度上,每个分片的写入数据总量近似相等。
3.根据权利要求1所述的方法,其特征在于,所述查询超时控制,包括:
若Solr缺省,则设定超时时间;
开启定时器,执行计时,执行查询;
判断执行时间;
若查询超时,则打断查询;
若查询未超时,则执行完整查询。
4.根据权利要求1所述的方法,其特征在于,所述数据读取打断,包括:
定义收集器的命中条数,在循环收集文档的过程中,拦截判断是否已经满足定义的期望个数;
如果满足,则执行打断控制,直接响应所述请求,避免继续扫描下一个段文件。
5.根据权利要求1所述的方法,其特征在于,所述倒排表逆向加载,包括:
在文档收集过程中,采用优先级最小堆队列技术并定义队列大小,每条满足的记录都放入队列中,通过优先级算法实现数据的进和出;
在扫描一个段之后,如果满足记录条数,则直接返回;
如果没有满足记录条数,则继续扫描下一个段,直至满足设定的期望个数为止。
6.根据权利要求1所述的方法,其特征在于,所述执行自定义标准评分,包括:
在没有应用打分的前提下,通过自定义相似度、权重或者打分对solr的打分进行扩展,并通过单例模式进行管理。
7.一种基于solr的信息检索的装置,其特征在于,所述装置包括:
解析模块,用于接收信息检索的请求,并获取所述请求中的参数,解析并识别所述参数;
启动模块,用于启动分布式查询控制,并根据触发条件启动行打断控制或者查询超时控制;
加载模块,用于采用段文件逆向加载和倒排表逆向加载的方式加载数据,执行自定义标准评分,并响应所述请求;
所述加载模块,具体用于:
采用横向分表进行数据横向的物理隔离,同时,按照数据写入数据、读取数据,采用加载最新表的数据并依据数据读取打断进行数据查询;
在solr的内部缺省处理控制逻辑中,采用从小到大的顺序进行段文件加载,并通过扩展solr缺省实现接口,完成从大到小的顺序加载段文件。
8.根据权利要求7所述的装置,其特征在于,所述启动模块,具体用于:
在索引写入中,采用哈希方式将数据均匀分配到表的各个分片上;
在时间维度上,每个分片的写入数据总量近似相等;
若Solr缺省,则设定超时时间;
开启定时器,执行计时,执行查询;
判断执行时间;
若查询超时,则打断查询;
若查询未超时,则执行完整查询。
9.根据权利要求7所述的装置,其特征在于,所述数据读取打断,包括:
定义收集器的命中条数,在循环收集文档的过程中,拦截判断是否已经满足定义的期望个数;
如果满足,则执行打断控制,直接响应所述请求,避免继续扫描下一个段文件;
在文档收集过程中,采用优先级最小堆队列技术并定义队列大小,每条满足的记录都放入队列中,通过优先级算法实现数据的进和出;
在扫描一个段之后,如果满足记录条数,则直接返回;
如果没有满足记录条数,则继续扫描下一个段,直至满足设定的期望个数为止;
在没有应用打分的前提下,通过自定义相似度、权重或者打分对solr的打分进行扩展,并通过单例模式进行管理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711164079.1/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置