[发明专利]一种基于智能合约的数据标注众包平台系统及众包数据标注方法在审
申请号: | 201811359732.4 | 申请日: | 2018-11-15 |
公开(公告)号: | CN109445948A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 孙善宝;张桂红;于治楼 | 申请(专利权)人: | 济南浪潮高新科技投资发展有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F21/62 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 林剑 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 数据标注 平台系统 包数据 区块 智能 基础设施 机器学习 评估方式 随机选取 训练模型 预测模型 质量评估 评估 准确率 写入 篡改 学习 | ||
1.一种基于智能合约的数据标注众包平台系统,包括数据标注众包平台和区块链基础设施,其特征在于,所述的数据众包平台提供数据众包任务的分配和管理,实现参与标注人员及机构的注册、审核及身份认证,同时提供标注数据评估众包任务,并将评估任务随机分配给数据标注质检员,最终形成评价结果;所述的区块链基础设施建立在一个P2P共识网络中,所述的P2P共识网络存在管理节点、背书节点和记账节点,共同合作实现智能合约的执行以及区块链新区块的生成;另外,通过第三方数字证书认证中心为参与众包任务的各个参与方提供身份证书及通信安全认证服务。
2.根据权利要求1所述的一种基于智能合约的数据标注众包平台系统,其特征在于,所述的数据众包任务分为数据标注任务和众包标注评估任务,数据标注任务由众包任务发起方通过所述的数据标注众包平台进行发布,并以智能合约的形式出现,同时生成所述的众包标注评估任务,用以标注数据的评估质量,参与数据标注任务的P2P共识网络中的各个参与节点共同维护一份账本,账本中记录数据标注任务和众包标注评估任务的智能合约的执行结果。
3.根据权利要求1所述的一种基于智能合约的数据标注众包平台系统,其特征在于,所述的数据标注质检员包含人工质检员和机器质检员,机器质检员是利用其推力模型对数据进行标注,并对比众包标注任务中的标注数据与机器标注数据,并进行综合评估。
4.根据权利要求1所述的一种基于智能合约的数据标注众包平台系统,其特征在于,所述的P2P共识网络,通过创建一个代币,并为其分配移动价值,作为数据众包任务的支付货币,同时将区块链中待执行的智能合约程序公开,供各个参与方及社区开发者检查和调用,所有的智能合约执行结果都将记录在区块链中。
5.根据权利要求1或4所述的一种基于智能合约的数据标注众包平台系统,其特征在于,所述的P2P共识网络是没有中心节点、通过节点间进行消息交换的网络体系,P2P共识网络存在管理节点、背书节点和记账节点,共同合作实现智能合约的执行以及区块链新区块的生成。
6.根据权利要求1所述的一种基于智能合约的数据标注众包平台系统,其特征在于,所述的管理节点负责参与节点的准入。
7.根据权利要求1所述的一种基于智能合约的数据标注众包平台系统,其特征在于,所述的第三方数字证书认证中心负责发放数字证书,为参与众包任务的各个参与方提供身份证书及节点间的通信安全认证服务。
8.根据权利要求4所述的一种基于智能合约的数据标注众包平台系统,其特征在于,所述的代币发行采用以太坊区块链,结构包括版本号、时间戳、交易Merkle树根摘要、合约执行状态、前区块摘要值和本区块摘要值,其中交易内容记录智能合约的执行结果,包括数据标注众包任务的智能合约,数据标注众包子任务智能合约和数据标注众包评估智能合约。
9.一种基于智能合约的众包数据标注方法,包括以下步骤:
A、利用云端中心区块链基础设施资源,形成P2P共识网络;
B、在所述的P2P共识网络中选出管理节点、背书节点和记账节点,并由第三方数字证书认证中心发放数字证书,实现节点间的互信;
C、所述的管理节点发行代币;
D、数据众包任务发布者、数据标注机构、数据标注员、数据标注质检员或机器质检员在所述的云端中心众包平台进行注册,提交其基本信息;
E、云端中心众包平台进行审核,审核通过后由所述的第三方数字证书认证中心发放数字证书,并进行相应的代币发放;
F、数据标注需求方通过数据标注众包平台,发布数据标注众包任务,其中包含对于数据标注的存储位置、鉴权方式、标注数据数量、标注内容以及计费标准,同时发布数据标注众包任务智能合约,将数据标注众包任务记录到区块链中;
G、所述的数据标注众包平台动态分配数据标注众包任务,由所述的数据标注员接受众包任务,产生数据标注子任务智能合约;
H、所述的数据标注员根据标注要求,下载数据,进行人工标注;
I、所述的数据标注员将标注后数据上传到所述的数据标注众包平台的指定位置,触发数据标注子任务智能合约的执行;
J、所述的数据标注众包平台根据标注数据结果,根据数据标注要求,产生众包标注评估任务,同时发布相应的智能合约;
K、所述的数据标注众包平台随机的将评估任务进行分发,由所述的标注质检员和机器质检员进行评估;
L、所述的机器质检员将利用其模型进行数据标注,比较标注偏差,进行数据标注质量打分,并且标注差异点;
M、所述人工质检员则进行人工查验,标注质量问题,并进行打分;
N、所述的人工或机器标注质检员将打分结果反馈给所述的数据标注众包平台;
O、所述的数据标注众包平台根据规则,确定最终的众包数据评估结果;
P、上述的步骤中的智能合约将在区块链基础设施P2P网络中广播;
Q、自动检查上述智能合约发起方的代币余额,如果余额不足则终止合约;
R、上述的步骤中的智能合约将自动根据合约内容执行,所述的背书节点收集到足够的背书后将结果发送给所述的记账节点,并由记账节点达成共识,生成新的区块,按照预先设定的计费规则完成代币扣款;
S、所述的区块链参与节点通过P2P共识网络获取最新区块链数据,更新各自本地账本记录。
T、所述的数据标注众包任务发布方获得标注结果,用于其模型的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811359732.4/1.html,转载请声明来源钻瓜专利网。