[发明专利]样本标注方法、装置及计算机存储介质在审
申请号: | 202210203816.9 | 申请日: | 2022-03-02 |
公开(公告)号: | CN114612711A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 张庆伍 | 申请(专利权)人: | 上海云从企业发展有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62;G06N20/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 李兴迪 |
地址: | 200000 上海市浦东新区中国(上海)自*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 标注 方法 装置 计算机 存储 介质 | ||
本申请提供一种样本标注方法、装置及计算机存储介质,包括基于各特征类别,针对候选样本执行预测,获得候选样本对应于各特征类别的各预测结果;根据候选样本对应于各特征类别的各预测结果,确定候选样本的样本类别;根据候选样本的样本类别,获取满足标注需求的未标注样本以进行样本标注。借此,本申请可自动筛选出对于模型训练具有较大增益效果的高质量样本,以减少人工标注成本,并提高样本标注效率。
技术领域
本申请实施例涉及数据处理技术领域,特别涉及一种样本标注方法、装置及计算机存储介质。
背景技术
在人工智能的实际应用过程中,需要针对模型预测准确性较差的情况,补充相关的训练数据以提升模型的预测效果,然而,若针对对应于所有情况的所有待标注数据进行标注,则需要投入大量的人力以及时间成本。
因此,如何从大量待标注数据中获取对模型增益最大的高质量的样本,以提升样本标注效率,进而提升模型的预测精度,减少人力成本,是当前亟需解决的技术课题。
发明内容
鉴于上述问题,本申请提供一种样本标注方法、装置及计算机存储介质,可获取对模型训练增益最大的高质量样本,以减少人工标注成本,并提高样本标注效率。
本申请第一方面提供一种样本标注方法,包括:基于各特征类别,针对候选样本执行预测,获得所述候选样本对应于各特征类别的各预测结果;根据所述候选样本对应于各特征类别的各预测结果,确定所述候选样本的样本类别;根据所述候选样本的样本类别,获取满足标注需求的未标注样本以进行样本标注。
本申请第二方面提供一种样本标注装置,包括:样本特征预测模块,用于基于各特征类别,针对候选样本执行预测,获得所述候选样本对应于各特征类别的各预测结果;样本类别预测模块,用于根据所述候选样本对应于各特征类别的各预测结果,确定所述候选样本的样本类别;样本标注模块,用于根据所述候选样本的样本类别,获取满足标注需求的未标注样本以进行样本标注。
本申请第三方面提供一种计算机存储介质,其特征在于,所述计算机存储介质中存储有用于执行上述第一方面所述的样本标注方法中各步骤的各指令。
综上所述,本申请各实施例提供的样本标注方法、装置及计算机存储介质,通过预测候选样本对应于各特征类别的各预测结果,以确定候选样本的样本类别,进而筛选出能够提高模型预测鲁棒性的高质量样本,以供进行模型训练,借以减少人工筛选样本的时间成本,并提高样本标注效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请示例性实施例的样本标注方法的处理流程图。
图2为利用本申请样本标注方法所获取的候选样本的预测结果示意图。
图3为本申请另一示例性实施例的样本标注方法的处理流程图。
图4为本申请另一示例性实施例的样本标注方法的处理流程图。
图5为本申请另一示例性实施例的样本标注方法的处理流程图。
图6为本申请示例性实施例的样本标注装置的结构框图。
具体实施方式
为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海云从企业发展有限公司,未经上海云从企业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210203816.9/2.html,转载请声明来源钻瓜专利网。