[发明专利]一种数据解析方法及装置在审
申请号: | 202010121236.6 | 申请日: | 2020-02-26 |
公开(公告)号: | CN111338800A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 石刚;陈天立;李适季;秦伟 | 申请(专利权)人: | 深圳市优网科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘晓菲 |
地址: | 518057 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 解析 方法 装置 | ||
本申请公开了一种数据解析方法及装置,在降低了解析成本的同时也提高了解析结果的实时性和准确性。该方法包括:在获取到待解析的目标数据后,首先判断目标数据是否满足预设分割条件,若是,则根据预设分割规则进行任务分割,获得分割结果;然后再根据分割结果,利用其它子节点对目标数据进行协助解析处理,获得解析结果,并在当再次满足预设分割条件时,利用更多的子节点同时对目标数据进行协助解析,以获得更加实时、准确的解析结果。
技术领域
本发明涉及数据处理技术领域,具体涉及一种数据解析方法及装置。
背景技术
随着移动互联网技术的高速发展,网络数据量呈现井喷状态,及时对各种类型数据进行实时分析,实现各种指数和数据的运算,已经是网络应用中的一项重要内容。
目前常用的数据解析方式是将所有任务都由中心节点服务器来统一进行任务调度,但在数据量越来越多且单台机器处理能力无法满足时,中心服务器并不知道需要多少台机器协同处理一个任务比较合适.或者需要人工指定申请多少资源,这样既不能合理地分配集群资源,同时又增加了维护人员的工作负担,并且由于把任务全部由中心服务器调度,间接增加了网络IO的延时和通讯次数,实时性效率难以得到保障。因此,现有的由中心节点服务器来统一进行任务调度的数据解析方式,解析成本高、效率低、维护困难。并且,解析结果也不够准确。
发明内容
有鉴于此,本发明提供一种数据解析方法及装置,以解决现有技术中数据解析成本高、效率低、维护困难以及解析结果不准确的技术问题。
为解决上述问题,本发明提供的技术方案如下:
第一方面,本申请实施例提供了一种数据解析方法,包括:
获取待解析的目标数据;
当所述目标数据满足预设分割条件时,根据预设分割规则进行任务分割,获得分割结果;
根据所述分割结果,对所述目标数据进行协助解析处理,获得解析结果;
当再次满足预设分割条件时,返回根据预设分割规则进行任务分割,并执行后续步骤。
可选的,所述预设分割条件为单位数据粒度的解析时长大于单位粒度生产时长的80%。
可选的,所述当所述目标数据满足预设分割条件时,根据预设分割规则进行任务分割,获得分割结果,包括:
当所述目标数据满足预设分割条件时,确定参加数据解析的子节点;
确定主节点和所述子节点的文件识别码;
计算所述目标数据中各个文件的HashCode;
根据所述HashCode和所述文件识别码确定所述HashCode所属文件是否在当前节点进行处理,以便确定是否利用当前节点对所述文件进行数据解析。
可选的,所述根据所述HashCode和所述文件识别码确定所述HashCode所属文件是否在当前节点进行处理,以便确定是否利用当前节点对所述文件进行数据解析,包括:
将所述HashCode和节点总数进行取余运算,得到余数;
判断所述余数与所述文件识别码是否相同;
若是,则确定所述HashCode所属文件是在当前节点进行处理,以便确定利用当前节点对所述文件进行数据解析;
如否,则确定所述HashCode所属文件不是在当前节点进行处理。
可选的,所述方法还包括:
当满足预设合并条件时,根据预设合并规则进行子节点合并,获得合并结果;
根据所述合并结果,对所述目标数据进行解析处理,获得解析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优网科技有限公司,未经深圳市优网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010121236.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置