[发明专利]数据标记化的冲突处理方法及装置在审
申请号: | 201710374968.4 | 申请日: | 2017-05-24 |
公开(公告)号: | CN107294956A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 刘敬良;黄凌志 | 申请(专利权)人: | 北京奇安信科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F17/27;G06F17/30;G06F21/62 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙)11391 | 代理人: | 康正德,孙晓芳 |
地址: | 100015 北京市朝阳区酒仙*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 标记 冲突 处理 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,特别是涉及一种数据标记化的冲突处理方法及装置。
背景技术
随着计算机技术的不断发展,利用计算机处理业务数据已经涉及到生活、工作、学习等各个方面,例如银行业务办理、平台的登录、用户信息统计等等。由此,在对数据进行处理的过程中,数据的安全性以及有效性就显得尤为重要。
采用现有技术对数据进行处理时,往往是对业务数据进行标记化以得到相应的字符串,但是,标记化后的字符串中并没有有效地保留业务数据的重要字段信息。但是,在某些业务当中,需要对业务数据的重要字段做校验,如果标记化后的字符串中没有保留业务数据的重要字段,就很容易导致数据的校验失败,从而无法完成数据提交和处理。
此外,在现有技术中,对数字进行标记化之后依然是数字,这种特性容易导致数据的冲突性问题,即不同的数字在标记化后可能得到相同的标记化数字,而数据冲突可能会导致去标记化后的数据并非原始的业务数据,从而造成业务数据的错误,带来不必要的麻烦。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据标记化的冲突处理方法及装置。
依据本发明的一方面,提供了一种数据标记化的冲突处理方法,包括:
接收原始数据,并解析获得所述原始数据的数据类型;
根据预先配置的策略选取与所述原始数据的数据类型匹配的标记化算法;
依据选取的标记化算法对所述原始数据进行标记化处理,得到所述原始数据转换的标记化数据;
判断所述标记化数据与本地数据库中已存储的其他标记化数据是否冲突;
若冲突,则依据特定规则对所述标记化数据进行调整,生成新的标记化数据,且所述新的标记化数据与冲突的标记化数据不同。
可选地,所述依据选取的标记化算法对所述原始数据进行标记化处理,得到所述原始数据转换的标记化数据,包括:
依据选取的标记化算法对所述原始数据本身进行转换,得到转换后的数字字符串;
为所述转换后的数字字符串添加校验符,得到所述原始数据转换的标记化数据。
可选地,所述为所述转换后的数字字符串添加校验符,包括:
为所述转换后的数字字符串添加用于识别业务的特征标识;和/或
为所述转换后的数字字符串添加所述选取的标记化算法标识。
可选地,所述为所述转换后的数字字符串添加校验符,得到所述原始数据转换的标记化数据,包括:
在所述转换后的数字字符串的头部添加用于识别业务的特征标识,在所述转换后的数字字符串的尾部添加所述选取的标记化算法标识,结合头部、尾部以及所述转换后的数字字符串得到所述原始数据转换的标记化数据。
可选地,所述用于识别业务的特征标识长度为6个字节;
所述选取的标记化算法标识长度为3个字节。
可选地,所述判断所述标记化数据与本地数据库中已存储的其他标记化数据是否冲突,包括:
从所述本地数据库中查找是否存在与所述标记化数据相同的其他标记化数据;
若存在,则进一步判断所述原始数据与所述其他标记化数据所对应的原始数据是否相同;
若是,则所述标记化数据与所述其他标记化数据不冲突;
若否,则所述标记化数据与所述其他标记化数据冲突。
可选地,所述本地数据库中预先保存了所述其他标记化数据和与其对应的原始数据之间的映射关系,判断所述原始数据与所述其他标记化数据所对应的原始数据是否相同,包括:
依据本地数据库中已存储的映射关系获取与所述其他标记化数据对应的原始数据;
判断所述原始数据与获取的所述其他标记化数据所对应的原始数据是否相同。
可选地,若所述本地数据库中不存在与所述标记化数据相同的其他标记化数据,则所述标记化数据与其他标记化数据不冲突。
可选地,所述判断所述标记化数据与本地数据库中已存储的其他标记化数据是否冲突,包括:
获取所述本地数据库中已存储的冲突位为1的标记化数据,其中,所述冲突位为1的标记化数据为已经进行过冲突判定的标记化数据;
从获取的冲突位为1的标记化数据中查找是否存在与所述标记化数据相同的其他标记化数据;
若存在,则进一步判断所述原始数据与所述冲突位为1的标记化数据所对应的原始数据是否相同;
若是,则所述标记化数据与所述其他标记化数据不冲突,并将所述标记化数据的冲突位置1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇安信科技有限公司,未经北京奇安信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710374968.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置