[发明专利]数据处理方法、装置及设备、可读介质有效
申请号: | 201611238099.4 | 申请日: | 2016-12-28 |
公开(公告)号: | CN107038202B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 徐凯;仝浩奇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/25 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王茹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 可读 介质 | ||
1.一种数据处理方法,其特征在于,包括以下步骤:
获取由至少两个数据序列组成的数据集,其中,每个数据序列的各项数据元素分别对应不同的属性,不同数据序列中存在同属性的数据元素;
从组成所述数据集的数据序列中确定一组同属性的数据元素为遍历元素;
遍历组成所述数据集的每个数据序列中除遍历元素外的剩余数据元素,将剩余数据元素相同的数据序列合并为一个数据序列,以使合并后的数据序列包括一项所述剩余数据元素、以及被合并的数据序列的遍历元素;
确定合并后的数据序列与未经合并的数据序列为组成所述数据集的数据序列。
2.根据权利要求1所述的方法,其特征在于,所述从组成所述数据集的数据序列中确定一组同属性的数据元素为遍历元素前,所述方法包括以下步骤:
如果任一数据序列的元素数目少于其他数据序列的元素数目,通过比较所述任一数据序列与其他数据序列,确定所述任一数据序列所缺少的数据元素的属性;
在所述任一数据序列内添加所确定的属性所对应预设数据元素。
3.根据权利要求2所述的方法,其特征在于,所述从组成所述数据集的数据序列中确定一组同属性的数据元素为遍历元素前,所述方法包括以下步骤:
识别各数据序列中各数据元素的数据类型,所述数据类型包括离散型、连续型、以及连续嵌套型;
在各数据序列中,保持同类型的各数据元素之间的原有次序的同时,将离散型的数据元素整体调整到剩余类型的数据元素之前。
4.根据权利要求3所述的方法,其特征在于,所述从组成所述数据集的数据序列中确定一组同属性的数据元素为遍历元素前,所述方法包括以下步骤:
将连续型以及连续嵌套型的数据元素分别转换为相应格式的离散型的数据元素。
5.根据权利要求1所述的方法,其特征在于,所述数据序列由以下数据元素组成:
支付日期、支付金额、付款账户、收款账户、支付产品。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述确定合并后的数据序列与未经合并的数据序列为组成所述数据集的数据序列后,所述方法还包括以下步骤:
从组成所述数据集的数据序列中确定另一组同属性的数据元素为迭代元素;
基于迭代元素执行如下第一迭代过程:
遍历组成所述数据集的每个数据序列中除迭代元素外的剩余数据元素,将剩余数据元素相同的数据序列合并为一个数据序列,以使合并后的数据序列包括一项所述剩余数据元素、以及被合并的数据序列的迭代元素;
确定合并后的数据序列与未经合并的数据序列为组成所述数据集的数据序列;
如果任一数据序列存在未做过迭代元素的数据元素,从组成所述数据集的数据序列中确定另一组同属性的数据元素为迭代元素,并返回执行所述第一迭代过程;
如果所有数据序列中均不存在未做过迭代元素的数据元素,确定本次迭代过程所确定的数据集为压缩数据集。
7.根据权利要求6所述的方法,其特征在于,所述确定本次迭代过程所确定的数据集为压缩数据集后,所述方法包括以下步骤:
将由连续型或连续嵌套型的数据元素分别转换得到的相应格式的离散型的数据元素还原为原来的连续型或连续嵌套型的数据元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611238099.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:输入装置
- 下一篇:数据分析支援装置及数据分析支援方法