[发明专利]数据一般化装置、数据一般化方法、程序有效
申请号: | 202080019664.6 | 申请日: | 2020-02-20 |
公开(公告)号: | CN113544683B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 长谷川聪 | 申请(专利权)人: | 日本电信电话株式会社 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金兰 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 一般化 装置 方法 程序 | ||
提供能够仅使用小容量的主存储装置,将大规模数据高速地进行一般化处理的数据一般化装置。将属性值进行一般化的数据一般化装置包括:排序部,按照辅助存储装置上的一般化层级中的属性值的排列顺序,对辅助存储装置上的属性值进行排序;属性值取得部,将排序后的属性值的一部分从辅助存储装置取得到主存储装置上;一般化层级取得部,将作为一般化层级的一部分、即与取得到主存储装置上的属性值中的处理对象的属性值对应的一般化层级从辅助存储装置取得到主存储装置上;一般化处理部,基于取得到主存储装置上的属性值和取得到主存储装置上的一般化层级,执行一般化处理;以及再排序部,将一般化处理后的属性值移动到辅助存储装置,排序为原来的顺序。
技术领域
本发明涉及将数据库上的个别数据进行隐匿的技术,涉及数据一般化装置、数据一般化方法、程序。
背景技术
已知将数据库的个别数据通过确定的方法进行隐匿的技术。例如,能够通过将数据库的各值进行一般化处理,来进行数据库的隐匿处理。所谓一般化处理是指将值进行通用化。例如如图1的例子所示,若将性别[男性]一般化则成为[人],若将年龄[13]一般化则成为[11-20]。多数一般化处理会准备用于表示称作一般化层级的值的通用化/特定化关系的树状结构,通过追溯树状结构(提高层级)来进行值的改写。例如,在该图的年龄的层级的情况下,关于13这个数字,若提高1个层级则成为[11-20],若提高2个层级则成为[11-40]。设为将这样在一般化中提高的层级的数量称作层级上升数。
现有技术文献
非专利文献
非专利文献1:西川记史、礒田有哉、出射英臣、茂木和彦、吉野雅之、清水晃、早水悠登、合田和生、喜连川优、“使用了非顺序型数据库引擎的大规模数据的对话性的非特定化手法的研究与初始评价(非順序型データベースエンジンを用いた大規模データの対話的な非特定化手法の検討と初期評価)”,数据工学研究会,p377,电子信息通信学会,2018
发明内容
发明所要解决的课题
实现一般化大致有两个方法。一个是在主存储装置上配置成为对象的数据库以及一般化层级而实现的方法。另一个是在辅助存储装置上配置成为对象的数据库以及一般化层级,并适当将少量的数据配置在主存储装置上而实现的方法。
前者能够高速执行,但在大规模数据库的情况下主存储装置的容量不足,故不能执行一般化处理。后者例如有主要使用RDBMS(关系/数据库管理系统)等来将数据库在辅助存储装置上配置,并使用SQL运算来实现一般化处理的方法(非专利文献1)。但是,在没有准备一般化处理专用的SQL运算而在SQL中实现一般化处理的情况下,需要花费工夫,由于不是专用运算故成为低效率(低速)。
因此在本发明中,以提供仅使用小容量的主存储装置,就能够将大规模数据高速地进行一般化处理的数据一般化装置。
用于解决课题的手段
本发明的数据一般化装置是将属性值进行一般化的数据一般化装置,其包括排序部、属性值取得部、一般化层级取得部、一般化处理部、再排序部。
排序部按照辅助存储装置上的一般化层级中的属性值的排列顺序,对辅助存储装置上的属性值进行排序。属性值取得部将排序后的属性值的一部分从辅助存储装置取得到主存储装置上。一般化层级取得部将作为一般化层级的集合中的一部分一般化层级、即与取得到主存储装置上的属性值中的处理对象的属性值对应的一般化层级从辅助存储装置取得到主存储装置上。一般化处理部基于取得到主存储装置上的属性值和取得到主存储装置上的一般化层级,执行一般化处理。再排序部将一般化处理后的属性值移动到辅助存储装置,排序为原来的顺序。
发明效果
根据本发明的数据一般化装置,能够仅使用小容量的主存储装置,高速地将大规模数据进行一般化处理。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电信电话株式会社,未经日本电信电话株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080019664.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电路基板及包含电路基板的电连接箱的制造方法
- 下一篇:深度图处理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置