[发明专利]一种保留分布特征的姓名脱敏方法有效

申请号：	201910366230.2	申请日：	2019-05-05
公开（公告）号：	CN110175468B	公开（公告）日：	2020-12-01
发明（设计）人：	张江鑫;张名民;李建元;蒋立靓;沈晓宇;钱裕佳	申请（专利权）人：	浙江工业大学;银江股份有限公司
主分类号：	G06F21/62	分类号：	G06F21/62
代理公司：	杭州斯可睿专利事务所有限公司 33241	代理人：	王利强
地址：	310014 浙江省***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种保留分布特征的姓名脱敏方法，从一个或多个数据库中收集待脱敏姓名数据；检验待脱敏姓名数据的合规性；姓、名频率密度及权重空间表建立，用混合线性同余发生器产生均匀随机数，用拒绝采样原理进行采样，根据采样结果统计得出姓、名概率密度表，根据概率密度表生成权重表，根据权重表生成权重区间表；将待脱敏姓名转化为Unicode码，根据相关算法进行计算得出结果；以结果为索引，结合前面所生成的权重区间表得出相关脱敏结果。本发明可行性强，能很好的保留脱敏结果的分析价值、能保证脱敏过程结果的一致性、能保证脱敏过程的多样性。
搜索关键词：	一种保留分布特征姓名方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种保留分布特征的姓名脱敏方法，其特征在于，所述方法包括如下步骤：(1)收集待脱敏姓名数据；(2)判断待脱敏姓名数据是否符合规范，将异常数据放入异常数据集单独处理；(3)对合规的待脱敏数据进行抽样统计，对姓、名生成概率密度区间，分级设置权重生成概率密度权重区间；(4)针对具体待脱敏姓名，分别判断姓和名所在概率密度区间的级别，然后将姓名中的字分别转化为Unicode码，计算姓、名脱敏后所在的区间系数：fNamecoef＝(2*Unicode₁+Unicode₂+Unicode₃)mod L₁lName₁coef＝(Unicode₁+2*Unicode₂+Unicode₃)mod L₂lName₂coef＝(Unicode₁+Unicode₂+2*Unicode₃)mod L₃其中L₁、L₂、L₃为对应级别的概率密度权重区间的总长度；(5)根据(4)所得出的系数结合各级别的概率密度权重区间表得出脱敏后的名字。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学;银江股份有限公司，未经浙江工业大学;银江股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910366230.2/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F21-00 防止未授权行为的保护计算机或计算机系统的安全装置
G06F21-02 .通过保护计算机的特定内部部件
G06F21-04 .通过保护特定的外围设备，如键盘或显示器
G06F21-06 .通过感知越权操作或外围侵扰
G06F21-20 .通过限制访问计算机系统或计算机网络中的节点
G06F21-22 .通过限制访问或处理程序或过程

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种保留分布特征的姓名脱敏方法有效

专利文献下载