[发明专利]数据处理方法及计算设备有效
申请号: | 202210938420.9 | 申请日: | 2022-08-05 |
公开(公告)号: | CN115017215B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 莫登耀;陆庆达 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F17/18 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 曹威;刘戈 |
地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 计算 设备 | ||
1.一种数据处理方法,其特征在于,包括:
获取检测对象的至少两个数据集对应的分位序列;其中,所述分位序列用以描述其对应数据集的概率分布,包括分位项;所述分位项包括分位点及分位值;
将所述至少两个数据集对应的分位序列进行合并处理,以确定所述分位序列中的分位值,在所述至少两个数据集构成的数据总集中对应的分位点;
根据合并结果,获得目标分位序列;其中,所述目标分位序列用以指示对所述检测对象进行处理;
其中,所述合并处理包括:按照所述至少两个数据集对应的分位序列中的不同分位值从小到大的顺序,选择任一个分位值执行如下合并操作:计算所述至少两个数据集在所述分位值及其前一个分位值构成区间上的数据分布数量;根据所述数据分布数量以及所述至少两个数据集对应的数据总量,确定所述至少两个数据集分别在所述区间上的分布概率;基于所述分布概率及所述前一个分位值对应的分位点,累积获得所述分位值对应的分位点。
2.根据权利要求1所述的方法,其特征在于,所述将所述至少两个数据集对应的分位序列进行合并处理,以确定所述分位序列中的分位值,在所述至少两个数据集构成的数据总集中对应的分位点包括:
按照所述至少两个数据集对应的分位序列中的不同分位值从小到大的顺序,选择任一个分位值执行如下合并操作:
计算所述至少两个数据集在所述分位值及其前一个分位值构成区间上的数据分布数量;
根据所述数据分布数量以及所述至少两个数据集对应的数据总量,确定所述至少两个数据集分别在所述区间上的分布概率;
基于所述分布概率及所述前一个分位值对应的分位点,累积获得所述分位值对应的分位点。
3.根据权利要求1所述的方法,其特征在于,任一个数据集的分位序列按照如下方式确定:
确定预先设定的多个分位点在所述数据集中分别对应的至少一个数据位置;
确定任一个分位点对应的至少一个数据位置分别对应的数据值;
基于任一个分位点对应的至少一个数据位置分别对应的数据值,计算获得所述分位点对应的分位值;
由所述多个分位点以及所述多个分位点分别对应的分位值,生成所述分位序列。
4.根据权利要求3所述的方法,其特征在于,所述确定预先设定的多个分位点在所述数据集中分别对应的至少一个数据位置包括:
针对预先设定的任一个分位点,根据所述数据集中的元素数量及所述分位点,计算获得分位位置;
在所述分位位置为整数情况下,将所述分位位置作为所述分位点对应的一个数据位置或者将所述分位位置对应的数据位置及所述数据位置相邻的下一个数据位置作为所述分位点对应的两个数据位置;
在所述分位位置为非整数情况下,将所述分位位置的向下取整值对应的数据位置以及与所述数据位置相邻的下一个数据位置作为所述分位点对应的两个数据位置。
5.根据权利要求4所述的方法,其特征在于,所述基于任一个分位点对应的至少一个数据位置分别对应的数据值,计算获得所述分位点对应的分位值包括:
基于任一个分位点对应的至少一个数据位置与所述分位位置的差值信息,确定所述至少一个数据位置分别对应的权重系数;
基于所述至少一个数据位置分别对应的权重系数,将所述至少一个数据位置分别对应的数据值进行加权求和,获得所述分位点对应的分位值。
6.根据权利要求3所述的方法,其特征在于,所述确定任一个分位点对应的至少一个数据位置分别对应的数据值包括:
针对任一个分位点对应的任一个数据位置,将所述数据集作为待处理序列;
从所述待处理序列中选取基准值,以及从所述待处理序列的两端数据值开始,分别与所述基准值进行比较,并根据比较结果交换数据位置,以利用所述基准值将所述待处理序列划分为小于所述基准值的第一子集以及大于所述基准值的第二子集,并获得所述基准值对应的基准位置;
若所述基准位置与所述数据位置相同,将所述基准值确定为所述数据位置对应的数据值;
若所述基准位置与所述数据位置不同,在所述数据位置小于所述基准位置情况下,将所述第一子集作为待处理序列;
在所述数据位置大于所述基准位置情况下,将所述第二子集作为待处理序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210938420.9/1.html,转载请声明来源钻瓜专利网。