[发明专利]数据标记化方法及装置在审
申请号: | 201710374969.9 | 申请日: | 2017-05-24 |
公开(公告)号: | CN107292191A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 刘敬良;黄凌志 | 申请(专利权)人: | 北京奇安信科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/30 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙)11391 | 代理人: | 康正德,孙晓芳 |
地址: | 100015 北京市朝阳区酒仙*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 标记 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,特别是涉及一种数据标记化方法及装置。
背景技术
随着计算机技术的不断发展,利用计算机处理业务数据已经涉及到生活、工作、学习等各个方面,例如银行业务办理、平台的登录、用户信息统计等等。由此,在对数据进行处理的过程中,数据的安全性以及有效性就显得尤为重要。
采用现有技术对业务数据进行处理时,往往通过对业务数据进行标记化以得到相应的字符串,但是,标记化后的字符串中并没有有效地保留业务数据的重要字段信息。但是,在某些业务当中,需要对业务数据的重要字段做校验,如果标记化后的字符串中没有保留业务数据的重要字段,就很容易导致数据的校验失败,从而无法完成数据提交和处理。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据标记化方法及装置。
依据本发明的一方面,提供了一种数据标记化方法,包括:
接收原始数据,并解析获得所述原始数据的数据类型;
根据预先配置的策略选取与所述原始数据的数据类型匹配的标记化算法;
依据选取的标记化算法对所述原始数据进行标记化处理,得到所述原始数据转换的标记化数据。
可选地,所述依据选取的标记化算法对所述原始数据进行标记化处理,得到所述原始数据转换的标记化数据,包括:
依据选取的标记化算法对所述原始数据本身进行转换,得到转换后的数字字符串;
为所述转换后的数字字符串添加校验符,得到所述原始数据转换的标记化数据。
可选地,所述为所述转换后的数字字符串添加校验符,包括:
为所述转换后的数字字符串添加用于识别业务的特征标识;和/或
为所述转换后的数字字符串添加所述选取的标记化算法标识。
可选地,所述为所述转换后的数字字符串添加校验符,得到所述原始数据转换的标记化数据,包括:
在所述转换后的数字字符串的头部添加用于识别业务的特征标识,在所述转换后的数字字符串的尾部添加所述选取的标记化算法标识,结合头部、尾部以及所述转换后的数字字符串得到所述原始数据转换的标记化数据。
可选地,所述用于识别业务的特征标识长度为6个字节;
所述选取的标记化算法标识长度为3个字节。
可选地,所述原始数据的数据类型包括以下任意一项:
随机数字、定长规则数字以及特定格式的数字,其中,所述定长规则数字的长度一定。
可选地,所述根据预先配置的策略选取与所述原始数据的数据类型匹配的标记化算法,包括:
依据所述数据类型识别所述原始数据是否为敏感数据,其中,所述敏感数据包括与安全隐私相关的数据;
若是,则根据预先配置的策略选取与所述原始数据的数据类型匹配的标记化算法。
可选地,所述敏感数据包括以下任意一个:身份标识数据、密码数据、账号数据、账号余额数据。
可选地,所述根据预先配置的策略选取与所述原始数据的数据类型匹配的标记化算法,包括:
根据预先定义的不同数据类型与至少一个标记化算法之间的对应关系,选取与所述原始数据的数据类型对应的标记化算法。
可选地,所述依据选取的标记化算法对所述原始数据进行标记化处理,得到所述原始数据转换的标记化数据之后,还包括:
建立所述标记化数据与所述原始数据之间的映射关系,并保存在本地数据库中。
可选地,所述方法还包括:对标记化数据进行去标记化处理。
可选地,所述对标记化数据进行去标记化处理,包括:
依据所述本地数据库中保存的映射关系,查找与所述标记化数据对应的原始数据并获取。
依据本发明的另一方面,还提供了一种数据标记化装置,包括:
解析模块,适于接收原始数据,并解析获得所述原始数据的数据类型;
选取模块,适于根据预先配置的策略选取与所述原始数据的数据类型匹配的标记化算法;
标记模块,适于依据选取的标记化算法对所述原始数据进行标记化处理,得到所述原始数据转换的标记化数据。
可选地,所述标记模块还适于:
依据选取的标记化算法对所述原始数据本身进行转换,得到转换后的数字字符串;
为所述转换后的数字字符串添加校验符,得到所述原始数据转换的标记化数据。
可选地,所述标记模块还适于:
为所述转换后的数字字符串添加用于识别业务的特征标识;和/或
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇安信科技有限公司,未经北京奇安信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710374969.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理方法及移动终端
- 下一篇:一种云计算环境中低调整率的保序加密方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置