[发明专利]特征库的生成方法和装置有效
申请号: | 201510173241.0 | 申请日: | 2015-04-13 |
公开(公告)号: | CN104809175B | 公开(公告)日: | 2018-02-27 |
发明(设计)人: | 朱仲颖;张钦;张黎敏 | 申请(专利权)人: | 上海达梦数据库有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 路凯,胡彬 |
地址: | 201203 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 生成 方法 装置 | ||
1.一种特征库的生成方法,其特征在于,包括:
根据预设的初始集元规模以及采样百分比,确定目标集元规模以及目标集元内特征记录的个数;
利用预设的随机种子随机生成个数与所述目标集元内特征记录的个数相同的随机数,并将生成的各随机数保存为初始随机步长数组,各随机数的取值范围均介于0到所述目标集元规模之间;
计算所述初始随机步长数组包含的各随机数之和;
在判断到所述初始随机步长数组包含的各随机数之和与所述目标集元规模一致时,将所述初始随机步长数组作为目标随机步长数组;
根据所述目标集元规模对整个目标记录进行划分;
对于划分得到的各集元,利用所述目标随机步长数组在该集元内获取相应的特征记录,作为该集元对应的样本库;
确定各集元对应的样本库的并集,作为所述整个目标记录的特征库。
2.根据权利要求1所述的方法,其特征在于,在计算所述初始随机步长数组包含的各随机数之和之后,在根据所述目标集元规模对整个目标记录进行划分之前,所述方法还包括:
在判断到所述初始随机步长数组包含的各随机数之和与所述目标集元规模不一致时,对所述初始随机步长数组包含的各随机数进行最多两次修正,得到目标随机步长数组,其中,所述目标随机步长数组包含的各随机数之和与所述目标集元规模之间的误差符合预设误差率。
3.根据权利要求2所述的方法,其特征在于,对所述初始随机步长数组包含的各随机数进行最多两次修正,得到目标随机步长数组,包括:
对所述初始随机步长数组包含的各随机数均等比例缩放并取整,得到第一次修正后的随机步长数组,其中,缩放系数为所述目标集元规模与所述初始随机步长数组包含的各随机数之和的比值;
在判断到所述第一次修正后的随机步长数组包含的各随机数之和与所述目标集元规模之间的误差符合预设误差率时,将所述第一次修正后的随机步长数组作为目标随机步长数组。
4.根据权利要求3所述的方法,其特征在于,在得到第一次修正后的随机步长数组之后,所述方法还包括:
在判断到所述第一次修正后的随机步长数组包含的各随机数之和与所述目标集元规模之间的误差不符合预设误差率时,根据所述目标集元规模和所述预设误差率,确定集元覆盖范围的下限值和上限值;
在所述集元覆盖范围的下限值至上限值之间,随机选取一个值作为修正参数,确定所述修正参数与所述第一次修正后的随机步长数组包含的各随机数之和的偏差;
在所述第一次修正后的随机步长数组中随机选取个数与所述偏差相同的随机数;
如果所述修正参数大于所述第一次修正后的随机步长数组包含的各随机数之和,则将所述随机选取的个数与所述偏差相同的各随机数均加1,得到第二次修正后的随机步长数组,并作为目标随机步长数组;
如果所述修正参数小于所述第一次修正后的随机步长数组包含的各随机数之和,则将所述随机选取的个数与所述偏差相同的各随机数均减1,得到第二次修正后的随机步长数组,并作为目标随机步长数组。
5.根据权利要求1-4任一所述的方法,其特征在于,根据预设的初始集元规模以及采样百分比,确定目标集元规模以及目标集元内特征记录的个数,包括:
计算预设的初始集元规模与预设的采样百分比之积;
在所述初始集元规模与采样百分比之积小于1时,扩大所述初始集元规模,直至计算到的扩大后的集元规模与采样百分比之积大于等于1,将扩大后的当前集元规模确定为目标集元规模,并将所述目标集元规模与采样百分比之积取整后确定为目标集元内特征记录的个数。
6.根据权利要求1-4任一所述的方法,其特征在于:
如果整个目标记录能整除目标集元规模,则划分得到的各集元包括:个数为整个目标记录整除目标集元规模之商、且规模为所述目标集元规模的集元;
如果整个目标记录不能整除目标集元规模,则划分得到的各集元包括:个数为整个目标记录整除目标集元规模之商、且规模为所述目标集元规模的集元,以及一个规模为整个目标记录整除目标集元规模之余数的集元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海达梦数据库有限公司,未经上海达梦数据库有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510173241.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图片清理的方法、装置以及终端设备
- 下一篇:一种基于关系的数据处理方法和系统