[发明专利]一种数据分析处理系统和数据处理方法有效
申请号: | 202010611247.2 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111813846B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 焦悦光;胡宗星;邱剑生;郭璐;崔静 | 申请(专利权)人: | 北京九章云极科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/22;G06F16/2455 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 分析 处理 系统 数据处理 方法 | ||
1.一种数据处理方法,应用于数据分析处理系统,其特征在于,包括:
获取流任务的第一数据结构的输入数据;
将所述第一数据结构的输入数据转换为第二数据结构的中间数据;
使用所述流任务的算子对所述中间数据进行处理,输出处理结果;
其中,所述第二数据结构包括静态数据区域和动态数据区域;
所述将所述第一数据结构的输入数据转换为第二数据结构的中间数据包括:
获取所述输入数据的数据类型;
根据所述数据类型,将所述第一数据结构的输入数据转换为第二数据结构的中间数据;
所述根据所述数据类型,将所述第一数据结构的输入数据转换为第二数据结构的中间数据包括:
根据所述输入数据的各字段的原数据类型,确定所述各字段在所述第二数据结构中对应的目标数据类型,所述目标数据类型包括静态数据类型和动态数据类型;
对所述第二数据结构中对应的静态数据和动态数据统一进行顺序编号,得到静态区域索引,以及,对所述动态数据单独进行顺序编号,得到动态区域索引;
根据所述静态区域索引、动态区域索引,以及所述各字段在所述第二数据结构中对应的目标数据类型,将所述第一数据结构的输入数据转换为第二数据结构的中间数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述输入数据的各字段的原数据类型,确定所述各字段在所述第二数据结构中对应的目标数据类型的步骤包括:
子步骤a:若所述输入数据的字段的原数据类型为静态,且所述数据类型是标量,将所述字段标记为静态数据;
子步骤b:若所述输入数据的字段的原数据类型为静态,且所述数据类型为非标量,对所述字段的各个子字段递归重复子步骤a,b;
子步骤c:若所述输入数据的字段的原数据类型为动态,所述字段包含的子字段的个数和名称是确定的,则对所述字段的各个子字段递归重复子步骤a,b,c;
子步骤d:若所述输入数据的字段的原数据类型为动态,且所述字段的子字段的个数或名称不确定,则标记为动态数据。
3.根据权利要求1所述的方法,其特征在于,在所述根据所述静态区域索引、动态区域索引,以及所述各字段在所述第二数据结构中对应的数据类型,将所述第一数据结构的输入数据转换为第二数据结构的中间数据的步骤之前,所述方法还包括:
根据所述静态区域索引的个数建立相应长度的静态数据区域;
根据所述动态区域索引的个数建立相应长度的动态数据区域。
4.根据权利要求1或3所述的方法,其特征在于,所述静态数据区域为变长数组,所述动态数据区域为变长数组。
5.根据权利要求4所述的方法,其特征在于,所述根据所述静态区域索引、动态区域索引,以及所述各字段在所述第二数据结构中对应的数据类型,将所述第一数据结构的输入数据转换为第二数据结构的中间数据的步骤包括:
将标记为静态数据的字段的值映射为所述静态数据区域中,与所述静态数据的字段对应的静态区域索引为下标的数组元素;
将标记为动态数据的字段的值映射为所述动态数据区域中,与所述动态数据的字段对应的动态区域索引为下标的数组元素;
将所述静态数据区域中,与所述动态数据的字段对应的静态区域索引为下标的数组元素的值设置为所述动态区域索引。
6.根据权利要求1所述的方法,其特征在于,所述获取所述输入数据的数据类型包括:
基于用户配置输入获取所述输入数据的数据类型;或
基于预先建立的数据类型预测模型确定所述输入数据的数据类型。
7.根据权利要求1所述的方法,其特征在于,所述输入数据包括嵌套数据和/或动态数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京九章云极科技有限公司,未经北京九章云极科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010611247.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种废硫酸汞试剂回收方法
- 下一篇:一种自流式道床洒水系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置