[发明专利]一种无损恢复的分布式多语种检索平台及其方法在审
申请号: | 201910816137.7 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110659157A | 公开(公告)日: | 2020-01-07 |
发明(设计)人: | 陆夏根;朱世伟;魏墨济;于俊凤;李晨;李宪毅 | 申请(专利权)人: | 安徽芃睿科技有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F16/22;G06F16/2458 |
代理公司: | 37221 济南圣达知识产权代理有限公司 | 代理人: | 张庆骞 |
地址: | 230000 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式节点 主节点 外存设备 多语种 多语种检索 访问频度 检索条件 索引表 无损 预设 配置 恢复 查询 调整数据 故障恢复 路由算法 内存状态 时间存储 索引内存 缓存层 内存 指向 通信 | ||
本公开提供了无损恢复的分布式多语种检索平台及其方法。其中,无损恢复的分布式多语种检索平台,包括主节点以及与主节点相互通信的分布式节点;主节点和分布式节点分别对应与一个外存设备相连,外存设备被配置为间隔预设时间存储与其相连的主节点或分布式节点所接收的数据及内存状态;在故障恢复时,将外存设备内的数据直接恢复到本地内存,并调整数据、操作路由算法,使之指向新的节点;主节点被配置为向分布式节点下发查询符合检索条件的多语种数据;分布式节点被配置为在索引内存缓存层的热点索引表中查询符合检索条件的多语种数据;所述热点索引表中存在有访问频度不小于预设访问频度阈值的多语种数据。
技术领域
本公开属于多语种大数据处理领域,尤其涉及一种无损恢复的分布式多语种检索平台及其方法。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
在确保高效计算、确保正确结果和实时响应的前提下,必须保证系统的高可用性,即发生故障时,实施最快速度的、用户无感知的故障恢复和持续服务。发明人发现,现有流数据处理引擎故障恢复机制还有严重缺陷,会造成数据丢失。另外,当面向海量大数据检索时,要对全表扫描或访问多磁盘,这样降低了索引表查询速度。
发明内容
为了解决上述问题,本公开提供一种无损恢复的分布式多语种检索平台及其方法,其降低内存资源消耗且提高索引表查询速度。
为了实现上述目的,本公开采用如下技术方案:
本公开的第一方面提供一种无损恢复的分布式多语种检索平台。
一种无损恢复的分布式多语种检索平台,包括:
主节点以及与主节点相互通信的分布式节点;主节点和分布式节点分别对应与一外存设备相连,所述外存设备被配置为间隔预设时间存储与其相连的主节点或分布式节点所接收的数据及内存状态;在故障恢复时,将外存设备内的数据直接恢复到本地内存,并调整数据、操作路由算法,使之指向新的节点;
所述主节点被配置为:向分布式节点下发查询符合检索条件的多语种数据;
所述分布式节点被配置为:
在索引内存缓存层的热点索引表中查询符合检索条件的多语种数据;所述热点索引表中存在有访问频度不小于预设访问频度阈值的多语种数据;
当热点索引表中存在符合检索条件的多语种数据时,则直接将查询到的多语种数据上传至主节点;
当热点索引表中不存在符合检索条件的多语种数据时,则转到索引持久化存储层继续查询符合检索条件的多语种数据,并将查询结果上传至主节点。
本公开的第二方面提供一种无损恢复的分布式多语种检索平台的工作方法。
一种无损恢复的分布式多语种检索平台的工作方法,包括:
在故障恢复时,将外存设备内的数据直接恢复到本地内存,并调整数据、操作路由算法,使之指向新的节点;
在查询数据时,主节点向分布式节点下发查询符合检索条件的多语种数据;
分布式节点在索引内存缓存层的热点索引表中查询符合检索条件的多语种数据;热点索引表中存在有访问频度不小于预设访问频度阈值的多语种数据;
当热点索引表中存在符合检索条件的多语种数据时,则直接将查询到的多语种数据上传至主节点;
当热点索引表中不存在符合检索条件的多语种数据时,则转到索引持久化存储层继续查询符合检索条件的多语种数据,并将查询结果上传至主节点。
本公开的有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽芃睿科技有限公司,未经安徽芃睿科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910816137.7/2.html,转载请声明来源钻瓜专利网。