[发明专利]一种基于智能合约的数据标注众包平台系统及众包数据标注方法在审

专利信息
申请号: 201811359732.4 申请日: 2018-11-15
公开(公告)号: CN109445948A 公开(公告)日: 2019-03-08
发明(设计)人: 孙善宝;张桂红;于治楼 申请(专利权)人: 济南浪潮高新科技投资发展有限公司
主分类号: G06F9/50 分类号: G06F9/50;G06F21/62
代理公司: 济南信达专利事务所有限公司 37100 代理人: 林剑
地址: 250100 山东省济南市*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标注 数据标注 平台系统 包数据 区块 智能 基础设施 机器学习 评估方式 随机选取 训练模型 预测模型 质量评估 评估 准确率 写入 篡改 学习
【说明书】:

发明涉及区块链、智能合约、数据众包、机器学习和深度学习技术领域,特别涉及一种基于智能合约的数据标注众包平台系统及众包数据标注方法。本发明的一种基于智能合约的数据标注众包平台系统及众包数据标注方法,将数据众包标注任务和标注结果质量评估任务进行分离,通过已经训练的模型进行对标注数据进行评估,同时随机选取多个标注数据质检员进行众包评估,综合多种评估方式确定数据标注质量;众包任务的整个过程都将利用区块链基础设施写入到区块链中,实现参与众包各方的互信,保障了行为的完整性和不可篡改性,这也在一定程度上提高了数据标注质量,进而提升训练模型的效率及预测模型的准确率。

技术领域

本发明涉及区块链、智能合约、数据众包、机器学习和深度学习技术领域,特别涉及一种基于智能合约的数据标注众包平台系统及众包数据标注方法。

背景技术

区块链技术,又称为分布式账本技术,是一种去中心信任化、集体维护分布式账本的技术方案,其利用块链式数据结构来验证与存储数据,其本质是由多个节点集体参与通过多方存储、多方计算的方式来实现数据不可篡改、计算结果可信的分布式数据库系统。区块链并不是一种单一的技术,而是多种技术融合的结果,利用区块链技术维护一个可靠的、难以篡改的账本记录,可以降低信任的风险,并能有效的降低众参与方协作的维护成本。

区块链技术的发展使得智能合约成为可能,智能合约是一段由一台计算机或者计算机网络按照签署合约的权利和义务自动执行的代码,合约的执行无需中心节点来进行控制,通过自动化脚本代码实现编程和操作数据。由于智能合约使用代码的方式,保证了合同条款的强制执行力;将智能合约与区块链相结合,使得合约的条款一旦设定,就没有第三方可以篡改。智能合约这一颠覆性的技术是区块链的重要特性,将会对人类社会结构产生重大变化。

近年来,人工智能技术发展迅速,其商业化速度超出预期,人工智能将会给整个社会带来颠覆性的变化,已经成为未来各国重要的发展战略。以深度学习为核心的算法演进,其超强的进化能力,在大数据的支持下,通过训练构建得到类似人脑结构的大规模卷积神经网络,已经可以解决各类问题。而云中心聚合了大量的物理硬件资源,并采用虚拟化技术将物理硬件设备的硬件资源进行抽象,实现异构网络计算资源的统一的分配、调度和管理,高效的实现了深度学习的训练任务。特别是在计算机视觉领域,各种复杂的因素往往以非线性的方式结合在一起,特征的学习尤其重要,通过海量数据的训练在很大程度上缓解了训练过拟合的问题,从大数据中进行深度学习也就需要大量训练样本数据的标注。

标注是对未处理的初级数据,包括语音、图片、文本、视频等进行加工处理(如标识发音人性别,判断噪音类型等),转换为机器可识别信息的过程。数据标注包含很多方面,例如图片类型分类、路况图片人车非识别、文本语法校验、图片相关性评估、图片文字提取、文本关键字提取、语音转写文本等等,这些标注工作往往需要人工来处理。

众包模式的出现,带来了新的可能,极大的提升任务的执行效率并且大幅降低成本,但是由于参与众包标注的工作者数量众多,专业背景和工作能力参差不齐,标注质量也就无法保证,这也导致最终模型的训练达不到预期的效果。在这种情况下,如何有效的保证众包标注数据的质量,形成更有价值的高质量样本,同时利用区块链和智能合约技术来保证众包承诺、数据标注质量责任认定成为亟需解决的问题。

发明内容

为了解决现有技术的问题,本发明提供了一种基于智能合约的数据标注众包平台系统及众包数据标注方法,将数据众包标注任务和标注结果质量评估任务进行分离,通过已经训练的模型进行对标注数据进行评估,同时随机选取多个标注数据质检员进行众包评估,综合多种评估方式确定数据标注质量;众包任务的整个过程都将利用区块链基础设施写入到区块链中,实现参与众包各方的互信,保障了行为的完整性和不可篡改性,这也在一定程度上提高了数据标注质量,进而提升训练模型的效率及预测模型的准确率。

本发明所采用的技术方案如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811359732.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top