[发明专利]样本评估方法、装置、设备及计算机可读存储介质有效
申请号: | 202111096572.0 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113554126B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 冯建设;张建宇;花霖;刘桂芬;陈军;王春洲;朱瑜鑫;赵一波;刘小双;成建洪;熊皓 | 申请(专利权)人: | 深圳市信润富联数字科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 晏波 |
地址: | 518000 广东省深圳市罗湖区桂园街道老围*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 评估 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种样本评估方法,其特征在于,所述样本评估方法包括以下步骤:
基于预设历史样本集合和预设比例,确定检测样本集合和待检测样本,其中,所述检测样本集合中的样本数等于所述预设历史样本集合中的样本总数与所述预设比例的乘积,所述待检测样本是所述预设历史样本集合中除所述检测样本集合之外的样本;
从所述检测样本集合中随机选取目标样本,基于预设核函数和所述目标样本,计算所述待检测样本的新颖度;
基于预设重构度测试函数和所述目标样本,计算所述待检测样本的可重构度;
基于所述待检测样本的新颖度和可重构度,确定所述待检测样本是否为高价值样本;
其中,所述基于预设重构度测试函数和所述目标样本,计算所述待检测样本的可重构度的步骤包括:
将所述待检测样本和所述目标样本输入包含预设测试模型的预设重构度测试函数,得到所述待检测样本的可重构度,其中,所述待检测样本的可重构度与所述待检测样本的标签,以及所述待检测样本输入预设训练模型得到的值有关。
2.如权利要求1所述的样本评估方法,其特征在于,所述基于预设核函数和所述目标样本,计算所述待检测样本的新颖度的步骤包括:
将所述待检测样本和所述目标样本输入预设核函数,得到新颖度;
更换所述目标样本,并循环所述将所述待检测样本和所述目标样本输入预设核函数,得到新颖度的步骤,得到多个新颖度;
将所述多个新颖度中的极值作为所述待检测样本的新颖度。
3.如权利要求1所述的样本评估方法,其特征在于,所述基于预设重构度测试函数和所述目标样本,计算所述待检测样本的可重构度的步骤之后,包括:
基于第一预设检验函数、第二预设检验函数和所述检测样本集合,确定新颖度上限值和可重构度上限值;
若所述待检测样本的新颖度大于所述新颖度上限值,且所述待检测样本的可重构度大于所述可重构度上限值,则执行所述基于所述待检测样本的新颖度和可重构度,确定所述待检测样本是否为高价值样本的步骤。
4.如权利要求3所述的样本评估方法,其特征在于,所述基于所述待检测样本的新颖度和可重构度,确定所述待检测样本是否为高价值样本的步骤包括:
基于所述待检测样本的新颖度和可重构度,计算所述待检测样本的样本价值度;
若所述样本价值度大于第一预设阈值,则确定所述待检测样本是高价值样本;
若所述样本价值度小于或等于第一预设阈值,则确定所述待检测样本不是高价值样本。
5.如权利要求1所述的样本评估方法,其特征在于,所述基于所述待检测样本的新颖度和可重构度,确定所述待检测样本是否为高价值样本的步骤之后,包括:
若所述待检测样本为高价值样本,则将所述待检测样本加入目标样本集合;
当所述目标样本集合的样本数量大于第二预设阈值时,将所述目标样本集合替换所述检测样本集合;
返回所述从所述检测样本集合中随机选取目标样本的步骤,直至所述预设历史样本集合中不存在为高价值样本的待检测样本,得到高价值样本集合。
6.如权利要求5所述的样本评估方法,其特征在于,所述返回所述从所述检测样本集合中随机选取目标样本的步骤,直至所述预设历史样本集合中不存在为高价值样本的待检测样本,得到高价值样本集合的步骤之后,包括:
接收新检测样本,基于所述高价值样本集合、所述预设核函数以及所述预设重构度测试函数,确定所述新检测样本是否为高价值样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市信润富联数字科技有限公司,未经深圳市信润富联数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111096572.0/1.html,转载请声明来源钻瓜专利网。