[发明专利]一种数据标注中的数据保护方法及系统有效
申请号: | 202110467376.3 | 申请日: | 2021-04-28 |
公开(公告)号: | CN113111369B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 李帜;王爽;郑灏;王帅 | 申请(专利权)人: | 杭州锘崴信息科技有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60 |
代理公司: | 北京中创云知识产权代理事务所(普通合伙) 11837 | 代理人: | 肖佳 |
地址: | 310053 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 标注 中的 保护 方法 系统 | ||
本发明涉及一种数据标注中的数据保护方法及系统,通过设置标注管理中心来对原始数据、标注数据、检查数据等不同用户端提供的数据所对应的元数据进行存储和管理,在数据提供方的原始数据、数据标注方的标注数据均得到保护的情况下,采用隐私机密计算技术进行联合数据模型训练,进而得到改进后的模型,从而挖掘出数据价值,使得标注数据和原始数据变为资产,实现了数据的资产化。进而能够汇集更大量的数据,提供更为细分的数据类型,为提高算法的准确度,为扩展数据应用领域提供了有力的支撑。同时,通过对原始数据进行数据保护处理,最大程度地保护了原始数据的安全性和私有资产的性质,防止数据被批量非法使用,很大程度避免了数据失控的风险。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据标注中的数据保护方法及系统。
背景技术
数据标注是人工智能,大数据行业一个重要的工作内容。很多人工智能算法,需要大量的标注后的数据用来改进算法,提高准确性。传统的数据标注系统,数据标注服务是一次性的,标注成果得不到保护,标注数据提供出去后就失控。另一方面,由于获得的渠道有限,获得的数据有限,无法获得更多数据,数据的细分种类也比较有限。
现有的标注系统,不仅原始数据需要提交给数据需求方,而且标注者标注的信息也需要提交到数据需求方,数据需求方直接使用标注的原始数据,进行优化算法等工作。标注数据提供出去后就失控,任何得到标注拷贝的人都可以直接反复使用,从而无法体现标注者的劳动权益。这样标注的成果不能得到保护,标注者只能获得一次回报,标注的价值没有得到体现。此外,标注商为了能够标注数据,需要能够看到或者听见“原始数据”,这就存在泄露数据的风险。比如,数据标注方通过截图,录音录像的方式获取原始数据,非常容易导致泄露数据,特别是批量数据的泄露。
发明内容
基于现有技术的上述情况,本发明的目的在于提供一种数据标注中的数据保护方法及系统,通过设置标注管理中心来对原始数据所对应的元数据进行存储和管理,通过使用安全计算方法在安全计算模块中进行保护原始数据的计算,从而避免了现有技术中的数据失控风险。
为达到上述目的,根据本发明的一个方面,提供了一种数据标注中的数据保护方法,包括步骤:
至少一个数据提供方对其提供的原始数据进行数据保护处理,以形成用于标注的数据;
至少一个数据标注方对所述用于标注的数据进行标注,以形成标注数据,并建立原始数据和标注数据的对应关系;
将所述原始数据、标注数据对应的元数据、以及原始数据和标注数据的对应关系保存至标注管理中心的元数据库中;
根据数据需求方的数据需求和算法需求,协调各数据提供方和数据标注方提供原始数据以及标注数据以用于计算;
数据需求方从标注管理中心中选用已有算法或通过算法接入网关提交新的算法给标注管理中心;
利用所述原始数据以及标注数据在安全环境下计算得到计算结果;
将所述计算结果提供至数据需求方。
进一步的,还包括检查步骤:
数据检查方对原始数据和标注数据进行检查,对标注数据的质量进行检查,建立原始数据、标注数据和检查数据的对应关系,并将所述检查数据对应的元数据、以及所述对应关系保存至元数据库中。
进一步的,各用户端将其提供的数据保存在各自的数据库中;所述用户端包括数据提供方、数据标注方、数据检查方和数据需求方。
进一步的,所述对其提供的原始数据进行数据保护处理,包括步骤:
在原始数据中加入自然人无法识别且不影响标注操作的干扰信息和/或跟踪信息。
进一步的,所述在原始数据中加入自然人无法识别且不影响标注操作的干扰信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州锘崴信息科技有限公司,未经杭州锘崴信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110467376.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置