[发明专利]数据分发方法和装置有效
申请号: | 201711132051.X | 申请日: | 2017-11-15 |
公开(公告)号: | CN108108390B | 公开(公告)日: | 2019-02-19 |
发明(设计)人: | 王树强 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F16/2455 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据分发 分发 目标数据 方法和装置 接收用户 同一数据 差异化 分散性 最大化 预设 数据库 保证 查找 | ||
本发明提供了一种数据分发方法和装置,该方法包括:接收用户的数据领取请求;根据所述数据领取请求,在预设数据库中查找未被所述用户领取且分发次数大于零的目标数据;将所述目标数据分发至所述用户,并将所述目标数据的分发次数减一。本发明通过将未被某个用户领取过,且分发次数大于零的数据分发给该用户,从而可以使得同一条数据能够分发给多个人,同时,同一个人对一条数据只能领取一次,从而保证了数据分发的最大化和差异化,通过分散性的收集各个用户对同一数据的处理结果,排除个人对某个数据的处理错误,从而可以保证对分发的数据的处理结果的准确性,提升数据分发的可靠性和准确性。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据分发方法和装置。
背景技术
随时人工智能的兴起,越来越多的行业已经开始应用深度学习来完善公司的产品。而深度学习的第一步,就是要保证模型数据集的准确性,因此,如何确保数据的准确性成为了重中之重。
传统技术中,在进行数据分发时,会对待分发的数据集进行分发范围的划分,例如数据集包括200条数据,规定第1~100条数据分发给用户A进行处理,第101~200条数据分发给用户B进行处理,按照数据范围进行分发,这种分发方式难以保证每个人都可以分发到数据,未做到真正的数据分发。
以问答场景为例进行说明,利用传统的数据分发方案,针对一个问题分发给用户A,那么用户A对该问题(可以理解为某个数据)做出的答案(可以理解为对该数据的处理结果)即作为该问题的正确答案。那么,采用单个用户对某条数据的处理结果来作为唯一的数据处理结果,则难以保证该问题答案(数据的处理结果)的准确度。进一步的,如果以该用户做出的问题答案来作为训练模型的数据集,则一方面无法保证数据集的准确性,另一方面也无法保证训练出的模型的准确度。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:如何提供一种数据分发方案来真正做到数据的分发,并提升数据分发性能。
发明内容
本发明提供了一种数据分发方法和装置,以解决现有技术中的数据分发方案所存在的数据分发可靠性差、准确性低的问题。
为了解决上述问题,根据本发明的第一方面,本发明公开了一种数据分发方法,该数据分发方法包括:
接收用户的数据领取请求;
根据所述数据领取请求,在预设数据库中查找未被所述用户领取且分发次数大于零的目标数据;
将所述目标数据分发至所述用户,并将所述目标数据的分发次数减一。
可选地,所述根据所述数据领取请求,在预设数据库中查找未被所述用户领取且分发次数大于零的目标数据之后,根据第一方面所述的数据分发方法还可以包括:
在所述预设数据库中生成所述用户对所述目标数据的领取记录;
对所述目标数据设置处理时间阈值;
可选地,所述将所述目标数据分发至所述用户,并将所述目标数据的分发次数减一之后,根据第一方面所述的数据分发方法还可以包括:
当所述用户领取所述目标数据的时间长度超过所述目标数据的处理时间阈值、且未接收到所述用户对所述目标数据的处理结果时,则将所述用户对所述目标数据的领取记录清除;
将所述目标数据的分发次数加一。
可选地,所述将所述目标数据分发至所述用户,并将所述目标数据的分发次数减一之后,根据第一方面所述的数据分发方法还可以包括:
当所述用户领取所述目标数据的时间长度未超过所述目标数据的处理时间阈值、且接收到所述用户对所述目标数据的处理结果时,将所述处理结果添加至所述用户对所述目标数据的领取记录中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711132051.X/2.html,转载请声明来源钻瓜专利网。