[发明专利]一种基于沙箱环境生成数据元件的方法及存储介质在审
申请号: | 202110984709.X | 申请日: | 2021-08-26 |
公开(公告)号: | CN113434854A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 陆志鹏;王希勤;朱立锋;郑曦;周崇毅;国丽;李勇;乔亲旺;胡成盛;胡俊;谢冬水 | 申请(专利权)人: | 中国电子信息产业集团有限公司 |
主分类号: | G06F21/53 | 分类号: | G06F21/53;G06K9/62 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 罗丹 |
地址: | 100190 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 环境 生成 数据 元件 方法 存储 介质 | ||
1.一种基于沙箱环境生成数据元件的方法,其特征在于,包括:
在沙箱环境下,构建、训练并优化数据元件模型;
加载优化后的数据元件模型,以对预设数据进行加工生产得到相应的数据元件,所述数据元件为通过所述数据元件模型按照预设处理方法处理而得到的具有预设功能的数据集或者数据特征;
其中,构建、训练以及优化所述数据元件模型的开发环境与所述数据元件的生产环境是分离的,以避免在生产环境下的数据外泄。
2.根据权利要求1所述的方法,其特征在于,
所述预设处理方法包括以下中的一种或多种:数据拼接、数据合并、特征选择、分组、区间化、数据聚合、指标以及特征提取处理。
3.根据权利要求1所述的方法,其特征在于,
训练所述数据元件模型的训练数据是脱敏处理后的样本数据。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对生产数据元件的生产环境内的所述预设数据进行访问权限控制,并设置对所有数据操作进行留痕处理,以基于所述留痕来对数据操作进行风险识别和分析。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
对所述数据元件的输出结果进行申报和审核。
6.根据权利要求1-5中任意一项所述的方法,其特征在于,构建数据元件模型,包括:
基于数据元件的不同需求定义不同的数据元件,并基于所定义的数据元件申请数据资源和计算资源来进行数据元件的开发,根据数据资源的分类分机确定所开发的数据元件的开发环境,通过样本数据对所开发的不同数据元件进行训练得到所述数据元件模型。
7.根据权利要求1-5中任意一项所述的方法,其特征在于,所述方法还包括:
在运行所述数据元件模型过程中,使用全量数据来对所述数据元件模型进一步进行优化,所述全量数据为所有的所述预设数据。
8.根据权利要求1-5中任意一项所述的方法,其特征在于,得到所述数据元件之后,所述方法还包括:
将所述数据元件存储到预设的数据元件库,以供后续调取使用,并将所述数据元件模型同时存储到所述数据元件库内。
9.根据权利要求8所述的方法,其特征在于,
所述数据元件包括标准数据元件和定制数据元件,其中,所述标准数据元件为通用的数据元件,所述定制数据元件为基于预设需求而设计的数据元件。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现权利要求1-9中任意一项所述的基于沙箱环境生成数据元件的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子信息产业集团有限公司,未经中国电子信息产业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110984709.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置