[发明专利]特征库的生成方法和装置有效
申请号: | 201510173241.0 | 申请日: | 2015-04-13 |
公开(公告)号: | CN104809175B | 公开(公告)日: | 2018-02-27 |
发明(设计)人: | 朱仲颖;张钦;张黎敏 | 申请(专利权)人: | 上海达梦数据库有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 路凯,胡彬 |
地址: | 201203 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种特征库的生成方法和装置。该方法包括确定目标集元规模以及目标集元内特征记录的个数;利用预设的随机种子随机生成个数与目标集元内特征记录的个数相同的随机数,并保存为初始随机步长数组;对初始随机步长数组进行最多两次修正,得到目标随机步长数组,修正效率高;根据目标集元规模对整个目标记录进行划分;利用目标随机步长数组在各集元内获取相应的特征记录,作为对应的样本库;将各集元对应的样本库的并集作为整个目标记录的特征库。目标随机步长数组只需生成一次就可用于所有集元,降低了数据库管理系统采集特征记录的性能开销,提高了CBO的分析效率,可满足采样随机性及采样率的精确性。 | ||
搜索关键词: | 特征 生成 方法 装置 | ||
【主权项】:
一种特征库的生成方法,其特征在于,包括:根据预设的初始集元规模以及采样百分比,确定目标集元规模以及目标集元内特征记录的个数;利用预设的随机种子随机生成个数与所述目标集元内特征记录的个数相同的随机数,并将生成的各随机数保存为初始随机步长数组,各随机数的取值范围均介于0到所述目标集元规模之间;计算所述初始随机步长数组包含的各随机数之和;在判断到所述初始随机步长数组包含的各随机数之和与所述目标集元规模一致时,将所述初始随机步长数组作为目标随机步长数组;根据所述目标集元规模对整个目标记录进行划分;对于划分得到的各集元,利用所述目标随机步长数组在该集元内获取相应的特征记录,作为该集元对应的样本库;确定各集元对应的样本库的并集,作为所述整个目标记录的特征库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海达梦数据库有限公司,未经上海达梦数据库有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510173241.0/,转载请声明来源钻瓜专利网。
- 上一篇:图片清理的方法、装置以及终端设备
- 下一篇:一种基于关系的数据处理方法和系统