[发明专利]一种数据处理方法及系统有效
申请号: | 201710971837.4 | 申请日: | 2017-10-18 |
公开(公告)号: | CN109684279B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 邓杰 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团公司 |
主分类号: | G06F16/17 | 分类号: | G06F16/17;G06F16/18 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 215163 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 系统 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取多个业务日志文件;其中,每个业务日志文件包括多个业务日志数据,每个业务日志数据包括用于表征业务操作的词项及词项特征信息;
对所述多个业务日志文件进行分析,建立映射文件,所述映射文件用于指示每个业务日志文件所包括的多个业务日志数据中每个业务日志数据的词项与词项特征信息之间的映射关系;所述对所述多个业务日志文件进行分析,建立映射文件,包括:基于所述词项及所述词项特征信息,对每个业务日志数据进行词项分割,获得索引文件与文档文件;其中,所述索引文件包括词项集合和所述词项集合中每个词项的词项特征信息对应的索引ID子集合,所述文档文件包括所述每个词项对应的词项特征信息,所述词项特征信息包括索引自增ID,所述索引ID子集合中的任一索引ID与所述索引自增ID对应,索引ID子集合中一个索引ID或者一个索引自增ID与一个词项特征信息相对应;以及,基于所述索引文件和所述文档文件,建立映射文件;
基于所述映射文件对所述每个业务日志数据进行数据重组,获得并存储待存储文件数据集合;其中,所述待存储文件数据集合中的每条文件数据的词项个数小于等于所述每个业务日志数据的词项个数。
2.如权利要求1所述的方法,其特征在于,所述基于所述映射文件对所述每个业务日志数据进行数据重组,获得待存储文件数据集合,包括:
基于所述索引文件与所述文档文件之间的关联关系对所述每个业务日志数据进行重组,获得待存储文件数据集合。
3.如权利要求2所述的方法,其特征在于,所述存储待存储文件数据集合,包括:
将所述待存储文件数据集合分别存储在弹性搜索集群的至少两个节点中。
4.如权利要求3所述的方法,其特征在于,在对所述待存储文件数据集合进行存储之后,所述方法还包括:
接收用户终端发送的搜索指令,并获取所述搜索指令中包括的至少一个查询词项;
确定所述待存储文件数据集合中与所述至少一个查询词项对应的目标文件数据;
向所述用户终端发送所述目标文件数据。
5.如权利要求4所述的方法,其特征在于,所述确定所述待存储文件数据集合中与所述至少一个查询词项对应的目标文件数据,包括:
获取所述搜索指令中的至少一个查询词项,建立主节点与所述用户终端之间的通信连接;
判断所述主节点中是否存在与所述至少一个查询词项对应的目标文件数据;
若存在,则确定所述目标文件数据;否则,从至少一个从节点上确定所述目标文件数据;其中,所述至少一个从节点为所述至少两个节点中的节点。
6.如权利要求5所述的方法,其特征在于,所述建立主节点与所述用户终端之间的通信连接,包括:
判断预设时间段内所述主节点与所述用户终端之间的通信连接是否建立成功;
若确定所述预设时间段内,所述主节点与所述用户终端之间的通信连接未建立成功,则按照预设规则确定所述至少一个从节点中一个从节点为主节点;
将新确定的所述主节点与所述用户终端建立通信连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团公司,未经中移(苏州)软件技术有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710971837.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文件获取方法、装置、终端及存储介质
- 下一篇:日志文件处理方法、装置及系统