[发明专利]一种数据处理方法及设备有效
申请号: | 201510783943.0 | 申请日: | 2015-11-16 |
公开(公告)号: | CN106709572B | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 毛仁歆 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N3/12 | 分类号: | G06N3/12 |
代理公司: | 北京睿博行远知识产权代理有限公司 11297 | 代理人: | 龚家骅 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理单元 选择概率 数据处理 数据处理设备 数据处理效率 分布式实现 迭代过程 海量数据 交叉处理 数据组合 遗传算法 适应度 数据集 数组 筛选 申请 | ||
1.一种数据处理方法,其特征在于,所述方法应用于包括多个数据处理单元的数据处理设备中,各所述数据处理单元中设有待处理的数据集,该方法包括:
根据各所述数据处理单元的数据集对应的适应度值确定各所述数据处理单元的选择概率值;
根据各所述数据处理单元的选择概率值从各所述数据处理单元中选择用于交叉处理的数组;
根据预设的算法对所述数组进行处理,以获取最优数据组合;
在根据各所述数据处理单元的数据集对应的适应度值确定各所述数据处理单元的选择概率值之前,还包括:
在所述数据处理单元存储所述数据集以及一个随机生成的数组;
根据所述数据处理单元中的数据集生成与所述数据处理单元对应的适应度值。
2.如权利要求1所述的方法,其特征在于,所述算法具体为遗传算法,在根据预设的算法对所述数组进行处理之后,还包括:
判断当前进程遗传算法处理的次数是否超过预设的阈值,
若是,将所述遗传算法处理后的数组作为最优特征;
若否,根据各所述数据处理单元对应的选择概率值从各所述数据处理单元中选择用于交叉处理的数组。
3.如权利要求2所述的方法,其特征在于,根据预设的算法对所述数组进行处理,具体为:
对所述数组进行交叉处理;
将进行交叉处理后的数组进行变异处理。
4.一种数据处理设备,其特征在于,所述设备包括多个数据处理单元,还包括:
确定模块,根据各所述数据处理单元的数据集对应的适应度值确定各所述数据处理单元的选择概率值;
选择模块,根据各所述数据处理单元的选择概率值从各所述数据处理单元中选择用于交叉处理的数组;
处理模块,根据预设的算法对所述数组进行处理,以获取最优数据组合;
生成模块,在所述数据处理单元存储所述数据集以及一个随机生成的数组,并根据所述数据处理单元中的数据集生成与所述数据处理单元对应的适应度值。
5.如权利要求4所述的数据处理设备,其特征在于,所述算法具体为遗传算法,还包括:
判断模块,判断当前进程遗传算法处理的次数是否超过预设的阈值,
若是,所述判断模块将所述遗传算法处理后的数组作为最优特征;
若否,所述判断模块根据各所述数据处理单元对应的选择概率值从各所述数据处理单元中选择用于交叉处理的数组。
6.如权利要求5所述的数据处理设备,其特征在于,所述处理模块具体用于:
对所述数组进行交叉处理;
将进行交叉处理后的数组进行变异处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510783943.0/1.html,转载请声明来源钻瓜专利网。