[发明专利]一种去中心化的数据生态系统有效
申请号: | 201810435333.5 | 申请日: | 2018-05-09 |
公开(公告)号: | CN108681811B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 吴妍;郑羲光 | 申请(专利权)人: | 北京慧听科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q20/28 |
代理公司: | 北京国序知识产权代理有限公司 11895 | 代理人: | 张帅超;王泽 |
地址: | 100107 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中心 数据 生态系统 | ||
本发明公开一种去中心化数据生态系统,包括:任务分配系统,将数据需求方的数据需求信息分配给数据提供方;收到数据提供方提供的数据后,将数据校对任务分别给数据校对方,载入校准数据到数据质量检测系统;数据质量检测系统,接收数据校对方的校对数据,根据校准数据和/或AI技术对校对数据检测,校对确认后向数据需求方交付成品数据,同时向结算系统提交支付指令,向任务分配系统反馈数据制作质量;结算系统,接收数据需求方的预付费用,根据支付指令从预付费用中向数据提供方以及数据校对方支付结算费用。本发明能以去中心化的方式保证人工校对数据工作的质量。
技术领域
本发明涉及人工智能数据库的供需生态系统技术领域,具体涉及一种去中心化的数据生态系统。
背景技术
近十年来,人工智能(AI)取得了飞速的发展。随着深度学习等技术的开源和计算设备的高速进步,人工智能已经开始逐渐影响人类生活的各个方面。智能语音、人脸识别、自动驾驶等技术已经不再只是学术界的热点,而是即将真实走入每个人的生活中。
在拥有无限可能的人工智能技术及应用背后,提供燃料的是海量的优质数据。这些数据作为人工智能算法的训练和测试数据,和机器学习算法拥有同样重要的地位。在深度学习算法已经全面开源的背景下,训练数据变得尤为重要。
在未来,人工智能技术的进步将更加大量依赖于海量的优质数据支持。一方面,现有的人工智能数据的产能有限,无法支持未来的数据需求。另一方面,我们每个人都已经在互联网上留下了大量数据,但这些数据的产权不明确,利用率有很大提升空间。目前的数据库产业链中,在数据库需求方和实际制作方之间存在着多级的中间商,导致数据制作效率低,成本高,并无法对采集者的个人信息数据安全提供保障。
应用区块链(去中心化)技术是利用海量碎片化互联网用户数据、提高数据产能及使用效率的最佳途径。去中心化的数据生态系统可以使得海量用户生成的个人数据安全性更高,即数据只对具体数量的数据真正需求方可见,从而排除了各级数据中间商获得数据中涵盖信息的可能。另外,去中心化的数据生态系统可以使得数据的提供方获得对于其提供的数据种类及去向的完全控制权,从而避免了数据中间商滥用数据提供方隐私及个人信息的可能。
尽管目前已经存在各种基于哈希(HASH)算法的去中心化协议和解决方案,但这些方案都不能直接被应用到一个去中心化的数据生态系统中。其中最主要的问题在于:数据(如语音数据、图像数据等)若想对一种人工智能算法(如深度学习)产生贡献,其数据本身需要被精确标注。如一句语音录音若想被语音识别算法所应用,必须有伴随这段语音信号的文本信号(即写明这段语音信号中的内容,以下称伴随数据)一并提供给算法进行训练。而获得对于某一数据对应的解释内容的工作,称为标注工作,通常需要人工进行校对标注。由此可见,目前的去中心化技术可以保证数据提供方提供的数据的唯一性、安全性及可对某一数据的交易进行记录等;也可以保证某一对数据的校对者校对产生的伴随数据的唯一性、安全性及可对某一校对后数据的交易进行记录。但目前,并不能以去中心化的方式保证人工校对数据工作的质量。若此环节不能保证,则产生的数据将不能被人工智能系统使用。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种去中心化数据生态系统。
为实现本发明的目的所采用的技术方案是:
一种去中心化数据生态系统,包括:
任务分配系统,用于将数据需求方的数据需求信息按预定的分配规则分配给数据提供方;在接收到数据提供方提供的数据后,将数据校对任务按预设分配规则分别给数据校对方,由数据校对方对数据进行标注,并载入校准数据到数据质量检测系统;
数据质量检测系统,用于接收数据校对方的校对数据,根据载入的校准数据和/或AI技术对校对数据进行检测,校对确认通过后向数据需求方交付成品数据,同时向结算系统提交支付指令,并同时向任务分配系统进行数据制作质量反馈;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京慧听科技有限公司,未经北京慧听科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810435333.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置