[发明专利]一种数据处理方法、装置及电子设备有效
申请号: | 201910251585.7 | 申请日: | 2019-03-29 |
公开(公告)号: | CN109993315B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 何向宇 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 电子设备 | ||
1.一种数据处理方法,包括:
获得第一类型的任务数据,所述第一类型的任务数据具有预置标注结果;
将所述第一类型的任务数据及第二类型的任务数据组成任务集,由至少一个目标用户对所述任务集中的任务数据进行标注,第二类型的任务数据是指没有预置标注结果的任务数据;
获得标记数据集,其中,所述标记数据集中包括至少一条标注数据,所述标注数据为所述目标用户对任务集中的任务数据进行标注后的数据;
若所述标记数据集中的第一标注数据满足第一条件,则将其划分为所述第一类型的任务数据,并利用所述第一标注数据中的用户标注信息生成所述第一标注数据的预置标注结果;
其中,所述第一条件包括:
所述第一标注数据由所述第二类型的任务数据标记生成;
且,第一目标用户与第二目标用户满足第二条件,所述第一目标用户为所述第一标注数据对应的目标用户,所述第二目标用户为所述第一类型的任务数据所生成的第二标注数据对应的目标用户。
2.根据权利要求1所述的方法,所述第二条件包括:
所述第一目标用户为所述第二目标用户中标注准确率高于第一阈值的目标用户。
3.根据权利要求1或2所述的方法,所述第二条件包括:
所述第一目标用户为:所述第二目标用户中具有相同用户标注信息的第一标注数据所对应的目标用户,且所述第一目标用户在所述第二目标用户的占比值高于第二阈值。
4.根据权利要求2所述的方法,所述第二目标用户的标注准确率通过以下方式获得:
将所述第二标注数据中的用户标注信息与对应的预置标注结果进行比对,得到比对结果,所述比对结果表明所述第二目标用户是否标注准确;
基于所述比对结果,生成所述第二目标用户的标注准确率。
5.根据权利要求4所述的方法,基于所述比对结果,生成所述第二目标用户的标注准确率,包括:
基于所述比对结果,获得所述第二目标用户在所述第一类型的任务数据中标注准确的数量值;
基于所述数量值与所述第一类型的任务数据的数量值,生成所述第二目标用户的标注准确率。
6.根据权利要求1所述的方法,还包括:
输出所述第一目标用户的用户标识。
7.根据权利要求1所述的方法,所述任务集中,所述第一类型的任务数据与所述第二类型的任务数据在数量上呈预设比例。
8.一种数据处理装置,包括:
标注单元,用于获得第一类型的任务数据,所述第一类型的任务数据具有预置标注结果;将所述第一类型的任务数据及第二类型的任务数据组成任务集,由至少一个目标用户对所述任务集中的任务数据进行标注,第二类型的任务数据是指没有预置标注结果的任务数据;
获取单元,用于获得标记数据集,其中,所述标记数据集中包括至少一条标注数据,所述标注数据为所述目标用户对任务集中的任务数据进行标注后的数据;
划分单元,用于若所述标记数据集中的第一标注数据满足第一条件,则将其划分为所述第一类型的任务数据,并利用所述第一标注数据中的用户标注信息生成所述第一标注数据的预置标注结果;
其中,所述第一条件包括:
所述第一标注数据由所述第二类型的任务数据标记生成;
且,第一目标用户与第二目标用户满足第二条件,所述第一目标用户为所述第一标注数据对应的目标用户,所述第二目标用户为所述第一类型的任务数据所生成的第二标注数据对应的目标用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910251585.7/1.html,转载请声明来源钻瓜专利网。