[发明专利]样本数据的处理方法、装置、服务器和存储介质在审
申请号: | 201910322574.3 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110263803A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 郭亚;赵智源;周书恒;祝慧佳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书提供了一种样本数据的处理方法、装置、服务器和存储介质。其中,方法包括:获取多个目标样本数据,目标样本数据携带有标注信息;根据目标样本数据所携带的标注信息,确定目标样本数据的标注信息熵;根据目标样本数据的标注信息熵,从多个目标样本数据中确定出标注质量符合预设的质量要求的第一目标数据。在本说明书实施例中,由于通过先确定出能够反映目标样本数据的标注信息的不确定度的标注信息熵来量化不同标注源针对同一样本数据标注时的一致性程度;进而可以根据上述标注信息熵筛选出标注质量相对校高的目标样本数据作为第一目标数据来使用,从而能够高效、准确地从多个目标样本数据中筛选出标注质量较高的数据,减少数据误差。 | ||
搜索关键词: | 标注信息 目标样本 样本数据 标注 多个目标 存储介质 目标数据 服务器 筛选 一致性程度 不确定度 数据误差 数据携带 质量符合 预设 量化 携带 | ||
【主权项】:
1.一种样本数据的处理方法,包括:获取多个目标样本数据,其中,所述目标样本数据携带有标注信息;根据所述目标样本数据所携带的标注信息,确定目标样本数据的标注信息熵;根据所述目标样本数据的标注信息熵,从所述多个目标样本数据中确定出标注质量符合预设的质量要求的目标样本数据作为第一目标数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910322574.3/,转载请声明来源钻瓜专利网。