[发明专利]一种样本查找方法及装置有效
申请号: | 201810090764.2 | 申请日: | 2018-01-30 |
公开(公告)号: | CN108280208B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 徐佳宏;朱吕亮 | 申请(专利权)人: | 深圳市茁壮网络股份有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06N3/02 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518004 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 查找 方法 装置 | ||
1.一种样本查找方法,其特征在于,包括:
将待查样本输入预先训练的神经网络模型,得到所述神经网络模型输出的映射值,所述神经网络模型为利用训练样本及任意两个输出结果之间的差值不小于1的训练目标训练得到;
在一级映射表中查找与所述映射值对应的值,作为一级映射结果;所述一级映射表的确定过程,包括:对所述神经网络模型输出的各个所述训练样本的映射值进行取整运算,得到各个所述训练样本的第一整数映射值;对各个所述训练样本的第一整数映射值进行排序;从排序后的各个所述训练样本的第一整数映射值中确定最小整数映射值和最大整数映射值;将各个所述训练样本的第一整数映射值减去所述最小整数映射值,得到各个所述训练样本的第二整数映射值;将各个所述训练样本的第二整数映射值及各个所述训练样本组成映射表,作为所述一级映射表;
在二级映射表中查找与所述一级映射结果对应的值,作为二级映射结果;所述二级映射表的确定过程,包括:将所述一级映射表中的各个所述第二整数映射值依次映射为1至N中的数值,作为K个二级映射元素中与所述一级映射表存在映射关系的二级映射元素的有效哈希值,所述N为大于1的整数;将K个所述二级映射元素中与所述一级映射表不存在映射关系的二级映射元素的值映射为-1,得到所述二级映射表,所述K为大于所述N的整数;
若所述二级映射结果为-1,则确定样本集合中不存在所述待查样本;
若所述二级映射结果为有效哈希值,则确定所述样本集合中存在所述待查样本;
所述神经网络模型的训练过程,包括:
将各个训练样本及各个所述训练样本各自对应的权重输入神经网络模型,得到所述神经网络模型输出的各个所述训练样本与各自对应权重的乘积,作为各个所述训练样本的映射值;
对各个所述训练样本的映射值进行排序,排序后得到有序输出值组;
计算排序后的各个所述训练样本的映射值中任意两个相邻映射值的差值;
若存在所述任意两个相邻映射值的差值小于1,则对所述任意两个相邻映射值的差值小于1的映射值对应的训练样本的权重进行调整,并返回执行将各个训练样本及各个所述训练样本各自对应的权重输入神经网络模型的步骤,直至排序后的各个所述训练样本的映射值中任意两个相邻映射值的差值均不小于1。
2.根据权利要求1所述的方法,其特征在于,所述确定所述样本集合中存在所述待查样本之前,还包括:
在三级映射表中查找与所述有效哈希值对应的样本,作为三级映射结果;
比较所述三级映射结果与所述待查样本是否相同;
若所述三级映射结果与所述待查样本相同,则确定所述样本集合中存在所述待查样本;
若所述三级映射结果与所述待查样本不相同,则确定所述样本集合中不存在所述待查样本。
3.根据权利要求1所述的方法,其特征在于,所述对所述任意两个相邻映射值的差值小于1的映射值对应的训练样本的权重进行调整,包括:
对所述任意两个相邻映射值的差值小于1,且所述任意两个相邻映射值的差值最小的映射值对应的训练样本的权重进行调整。
4.根据权利要求2所述的方法,其特征在于,所述三级映射表的确定过程,包括:
将所述二级映射表中的有效哈希值依次映射为对应的样本,得到所述三级映射表。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述将待查样本输入预先训练的神经网络模型,包括:
将所述待查样本的超长位串属性值输入预先训练的神经网络模型;
所述待查样本的超长位串属性值的确定过程,包括:
将所述待查样本的各个属性值转换为位串属性值;
从各个所述位串属性值中确定出最大的位串属性值;
将所述最大的位串属性值对应的位串属性长度作为所述待查样本的定长位串属性长度;
按照所述定长位串属性长度,将各个所述位串属性值转换为定长位串属性值;
将各个所述定长位串属性值进行连接,得到所述超长位串属性值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市茁壮网络股份有限公司,未经深圳市茁壮网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810090764.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种构造完美哈希的方法
- 下一篇:一种基于烟花算法的图像检索方法和系统