[发明专利]样本标注方法、装置及计算机存储介质在审
申请号: | 202210203816.9 | 申请日: | 2022-03-02 |
公开(公告)号: | CN114612711A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 张庆伍 | 申请(专利权)人: | 上海云从企业发展有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62;G06N20/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 李兴迪 |
地址: | 200000 上海市浦东新区中国(上海)自*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 标注 方法 装置 计算机 存储 介质 | ||
1.一种样本标注方法,包括:
基于各特征类别,针对候选样本执行预测,获得所述候选样本对应于各特征类别的各预测结果;
根据所述候选样本对应于各特征类别的各预测结果,确定所述候选样本的样本类别;
根据所述候选样本的样本类别,获取满足标注需求的未标注样本以进行样本标注。
2.根据权利要求1所述的样本标注方法,其中,所述候选样本包括多个,且所述基于各特征类别,针对候选样本执行预测,获得所述候选样本对应于各特征类别的各预测结果,包括:
根据候选样本的数量、每一个候选样本的样本特征的特征维度,生成样本特征矩阵;
根据所述样本特征矩阵,获得类别分布公式;
利用所述类别分布公式,以基于各特征类别,针对每一个候选样本执行预测,获得每一个候选样本对应于各特征类别的各预测结果。
3.根据权利要求2所述的样本标注方法,其中,所述类别分布公式表示为:
其中,所述x表示所述样本特征矩阵,所述k表示所述候选样本的数量,所述∑为所述样本特征矩阵的协方差矩阵,所述μ为所述样本特征矩阵中的每一列的平均值。
4.根据权利要求2所述的样本标注方法,其中,所述方法还包括:
利用训练好的变分自编码器针对每一个候选样本执行预测,以获得每一个候选样本的样本特征。
5.根据权利要求2或3所述的样本标注方法,其中,所述特征类别包括第一特征类别和第二特征类别;
且其中,所述利用所述类别分布公式,以基于各特征类别,针对每一个候选样本执行预测,获得每一个候选样本对应于各特征类别的各预测结果,包括:
利用所述类别分布公式,基于所述第一特征类别、每一个候选样本的样本特征,针对每一个候选样本执行类别分布预测,获得每一个候选样本对应于所述第一特征类别的第一类别分布值;
利用所述类别分布公式,基于所述第二特征类别、每一个候选样本的样本特征,针对每一个候选样本执行类别分布预测,获得每一个候选样本对应于所述第二特征类别的第二类别分布值。
6.根据权利要求5所述的样本标注方法,其中,所述候选样本包括图像样本,所述第一特征类别为所述候选样本包含有指定对象,所述第二特征类别为所述候选样本不包含所述指定对象。
7.根据权利要求5所述的样本标注方法,其中,所述样本类别包括第一样本类别,所述候选样本包括已标注样本;
且其中,所述根据所述候选样本对应于各特征类别的各预测结果,确定所述候选样本的样本类别,包括:
根据所述候选样本的第一类别分布值、第二类别分布值、预设高阈值、预设低阈值,将所述第一类别分布值与所述第二类别分布值中的一个高于所述预设高阈值,且所述第一类别分布值与所述第二类别分布值中的另一个低于所述预设低阈值的候选样本确定为目标样本;
根据所述目标样本的第一类别分布值和第二类别分布值,确定所述目标样本的预测标签;
根据所述目标样本的真实标签,若所述目标样本的预测标签与所述真实标签不吻合,将所述目标样本确定为所述第一样本类别。
8.根据权利要求7所述的样本标注方法,其中,所述根据所述候选样本的样本类别,获取满足标注需求的未标注样本进行标注,包括:
将具有所述第一样本类别的候选样本的样本特征与每一个未标注样本的样本特征执行比对,以从未标注样本中获取具有所述第一样本类别的候选样本的相似样本;
针对所述相似样本进行样本标注。
9.根据权利要求5所述的样本标注方法,其中,所述样本类别包括第二样本类别,所述候选样本包括未标注样本;
且其中,所述根据所述候选样本对应于各特征类别的各预测结果,确定所述候选样本的样本类别,包括:
根据所述候选样本的第一类别分布值、第二类别分布值、预设低阈值,将所述第一类别分布值与所述第二类别分布值均低于所述预设低阈值的候选样本确定为第二样本类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海云从企业发展有限公司,未经上海云从企业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210203816.9/1.html,转载请声明来源钻瓜专利网。