[发明专利]用于企业的私有化部署数据处理方法有效
申请号: | 201911071132.2 | 申请日: | 2019-11-05 |
公开(公告)号: | CN110826101B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 吴鑫坤;张子斌 | 申请(专利权)人: | 安徽数据堂科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;G06Q10/06;H04L29/08 |
代理公司: | 合肥正则元起专利代理事务所(普通合伙) 34160 | 代理人: | 韩立峰 |
地址: | 230000 安徽省合肥市蜀山区新产业*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 企业 私有化 部署 数据处理 方法 | ||
1.用于企业的私有化部署数据处理方法,其特征在于,该处理方法包括以下步骤:
S1:通过用户登录模块对用户和用户角色进行身份校验并将身份校验通过的用户与服务器建立通信连接;
S2:企业内部人员通过内网发送企业的私有数据以及私有数据对应的等级在企业私有云内进行存储;
S3:通过标注任务模块对私有数据进行任务创建,将创建的待标注任务绑定数据发送至智能工具模块进行处理,智能工具模块基于人在回路的增量式数据辅助标注技术对待标注任务进行标注,智能工具模块将无法标注的待标注任务发送至标注分配模块;
标注任务模块用于通过服务器获取企业私有云内私有数据以及私有数据对应的等级进行任务创建,将需要标注的私有数据标记为待标注任务;创建好任务后,需要给该待标注任务绑定数据,任务绑定数据支持按照数据集下的批次绑定和索引绑定,绑定数据后,标注任务模块将待标注任务发送至标注分配模块;所述标注分配模块用于将私有数据分配至对应的标注员电脑终端上,具体分配步骤如下:
步骤一:设定待标注任务记为Dji,j=1、2、3、4;i=1……n;D1i、D2i、D3i、D4i依次表示为语音、图片、视频和文本;设定待标注任务等级记为GDji;待标注任务对应的文件大小为KDji;
步骤二:设定待标注任务对应的积分值标记为Cj,j=1、2、3、4;且C4C2C3C1;
步骤三:利用公式获取得到待标注任务的排序值PDji;其中λ为修正因子,取值为1.2;v1、v2和v3均为预设比例系数固定值;
步骤四:待标注任务进行依照排序值进行分类,设定分类区间记为A1、A2、A3和A4,且A1、A2、A3和A4的取值区间依次减小;当待标注任务排序值在分类区间A1内,则将该待标注任务标记为第一私有数据;当待标注任务排序值在分类区间A2内,则将该待标注任务标记为第二私有数据;当待标注任务排序值在分类区间A3内,则将该待标注任务标记为第三私有数据;当待标注任务排序值在分类区间A4内,则将该待标注任务标记为第四私有数据;
步骤五:统计所有第一私有数据、第二私有数据、第三私有数据和第四私有数据;分别构成第一私有数据集合、第二私有数据集合、第三私有数据集合和第四私有数据集合;
步骤六:根据标注员的标注权限值将标注员划分为第一标注员、第二标注员、第三标注员和第四标注员;第一标注员用于对第一私有数据进行标注,第二标注员用于对第二私有数据进行标注;第三标注员用于对第三私有数据进行标注,第四标注员用于对第四私有数据进行标注;标注权限值通过权限计算模块进行计算,具体计算步骤如下:
SS1:设定标注员记为Wi,i=1、……、n;标注员为机构内部标注工程师或企业内部人员;设定标注员的标注私有数据的数量记为MWi;标注员的标注错误总次数标记为CWi;
SS2:利用公式QWi=MWi*Zk1-CWi*Zk2获取得到标注员的标注权限值QWi;其中Zk1和Zk2为预设比例系数;k=1、2;Z11、Z12表示为机构内部标注工程师标注私有数据的数量的预设比例系数和标注错误总次数的系数;Z21、Z22表示为企业内部人员标注私有数据的数量的预设比例系数和标注错误总次数的系数;
SS3:依次由大到小设置第一阈值、第二阈值、第三阈值;当标注员的标注权限值大于或等于第一阈值,则将该标注员标记为第一标注员;当标注员的标注权限值小于第一阈值且大于或等于第二阈值,则将该标注员标记为第二标注员;当标注员的标注权限值小于第二阈值且大于或等于第三阈值,则将该标注员标记为第三标注员;当标注员的标注权限值小于第四阈值,则将该标注员标记为第四标注员;
步骤七:统计第一标注员的所有人数记为R1,同时将第一标注员依照标注权限值由大到小进行排序;统计第一私有数据集合中第一私有数据的数量记为R2;利用公式R3=R2/R1获取得到第一标注员的标注数量R3,当不能整除时,R3的取值为商直接加上数值一;
步骤八:将第一私有数据集合中的第一私有数据依照排序值由大到小进行排序,将排序值靠前的R3个第一私有数据分配至标注权限值最大的第一标注员的电脑终端上,依次类推;同理,第二私有数据集合、第三私有数据集合和第四私有数据集合依照上述进行分配到对应标注员的电脑终端上;第一标注员、第二标注员、第三标注员和第四标注员通过标注工具对对应的第一私有数据、第二私有数据、第三私有数据和第四私有数据进行标注;
S4:标注分配模块将私有数据分配至对应的标注员电脑终端上,通过模板配置模块对不同的待标注任务进行区分配置,标注员在电脑终端上通过标注工具对待标注任务进行标注;
S5:标注员将标注好的待标注任务发送至智能工具模块,通过结果导出模块将标注结果导出到本地。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽数据堂科技有限公司,未经安徽数据堂科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911071132.2/1.html,转载请声明来源钻瓜专利网。