[发明专利]一种样本筛选方法有效
申请号: | 201611270693.1 | 申请日: | 2016-12-30 |
公开(公告)号: | CN106845532B | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 张宾;张兆丰;杨龙;牟永强;田第鸿 | 申请(专利权)人: | 深圳云天励飞技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06F17/30 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 李利 |
地址: | 518000 广东省深圳市龙岗区横岗*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 筛选 方法 | ||
1.一种样本筛选方法,其特征在于,所述样本筛选方法包括以下步骤:
A、计算两个待比较文件夹中图片的相似值的平均值;
B、根据得到的平均值求出该平均值下的概率;
C、根据概率判断两个文件夹中图片是否为同一人物;当概率越大时,则为同一个人物几率越大,当概率较小时,则为同一个人物几率较小。
2.根据权利要求1所述的样本筛选方法,其特征在于,所述步骤A中还包括以下步骤:
A1、依次计算两个文件夹中所有图片的相似值;
A2、根据所得到的所有相似值求和并进而求出平均值。
3.根据权利要求2所述的样本筛选方法,其特征在于,所述步骤A2中两文件夹中图片的平均值为savg,其公式为:m,n为文件夹A和B中分别有图片张数,saibj为A中图片ai和B中图片bj的相似值。
4.根据权利要求3所述的样本筛选方法,其特征在于,所述步骤B中两文件夹中图片为同一人的概率为PAB,其公式为其中,savg为两文件夹中图片的平均值,Psc为两张图片为同一人物的概率,1-Psc为两张图片为不同人物的概率,Pf(s)为两张图片是不同人物且相似度为s的概率,Pt(s)为两张图片为相同人物且相似度为s的概率。
5.一种样本筛选方法,其特征在于,所述样本筛选方法包括以下步骤:
a、依次计算两个文件夹中所有图片的相似值;
b、根据所得到的所有相似值求和;
c、根据相似值求得的和计算出平均值;
d、根据得到的平均值判断两个文件夹中图片是否为同一人,当平均值越高时,则两个文件夹中的图片为同一人物的几率越大,当平均值越低时,则两个文件夹中的图片为同一人物的几率越小。
6.根据权利要求5所述的样本筛选方法,其特征在于,所述步骤a中的相似值为sAB,其公式为其中,m、n为两个文件夹中图片的张数,saibj为A中图片ai和B中图片bj的相似值。
7.一种样本筛选方法,其特征在于,所述样本筛选方法包括以下步骤:
(1)、依次计算两个待比较文件夹中图片为同一人物的概率;
(2)、将所求得的所有概率值相加求出平均值;
(3)、根据求得的平均概率值判断两文件夹中图片是否为同一人物,当平均概率值越大,则两个文件夹中图片为同一个人的几率越大,当平均概率值越小,则两个文件夹中图片为同一个人的几率越小。
8.根据权利要求7所述的样本筛选方法,其特征在于,所述步骤(1)中根据局部人工抽样筛选之后的数据统计与计算两张图片为同一人物的概率为Psc,其公式为:N为图片集中的图片张数,S为相同人物图片对数。
9.根据权利要求8所述的样本筛选方法,其特征在于,所述步骤(1)中两张图片为相同人物且相似度为s的概率为Pt(s),其公式为两张图片是不同人物且相似度为s的概率为Pf(s),其公式为N为图片集中的图片张数,S为相同人物图片对数,TS为相同人物且相似度为s的图片对数,FS为不是同一人物且相似度为s的图片对数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云天励飞技术有限公司,未经深圳云天励飞技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611270693.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于测量气体汤逊放电参数的真空实验装置
- 下一篇:定子和具有其的电机