[发明专利]一种基于置信度确定样本回收量的方法和设备有效
申请号: | 201510591972.7 | 申请日: | 2015-09-16 |
公开(公告)号: | CN106548186B | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 薛研歆;周幼静;余井霞;方惠如;袁赓拓;张培 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京睿博行远知识产权代理有限公司 11297 | 代理人: | 龚家骅 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种基于置信度确定样本回收量的方法,所述方法包括:服务器获取所有样本的置信度;所述服务器根据各个样本的置信度确定各个样本的回收量。本申请通过样本置信度确定出不同置信度对应样本的回收量,可以减少总样本的回收量,还保证了样本标注的准确度。 | ||
搜索关键词: | 一种 基于 置信 确定 样本 回收 方法 设备 | ||
【主权项】:
1.一种基于置信度确定样本回收量的方法,其特征在于,所述方法包括:服务器获取所有样本的置信度;所述服务器根据各个样本的置信度确定各个样本的回收量;所述服务器获取所有样本的置信度,具体为:所述服务器通过向量空间模型确定所有样本的向量与标准样本的向量之间的相似度,并通过所述相似度得到所述所有样本的置信度;所述服务器根据各个样本的置信度确定各个样本的回收量,具体为:所述服务器根据各个样本的置信度确定出置信度最低的样本;所述服务器根据预设的置信度和回收量的对应规则确定所述置信度最低的样本的回收量N;所述服务器根据预先设定的划分规则将标准正态分布图划分为M份面积相等的图形;所述服务器根据回收量N确定各个图形对应的回收量;所述服务器根据所述标准正态分布图X轴对应的距离平均值的偏移量确定各个图形对应的偏移量区间;所述服务器根据各个样本置信度的标准化值通过各个图形对应的偏移量区间和各个图形对应的回收量确定各个样本所对应的回收量;其中,N>M。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510591972.7/,转载请声明来源钻瓜专利网。