[发明专利]数据清理方法及装置有效
申请号: | 201610710396.8 | 申请日: | 2016-08-23 |
公开(公告)号: | CN106997369B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 罗鸣 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 清理 方法 装置 | ||
1.一种数据清理方法,其特征在于,所述方法用于对数据库中的多个数据节点进行处理,其中每个数据节点对应一个数据表,所述方法包括:
在接收到业务信息时,为所述业务信息对应的第一数据节点添加对应的节点标记;
在数据血缘关系表中查询到所述第一数据节点时,以所述第一数据节点为起点,查询所述多个数据节点中所述第一数据节点的上游节点,所述上游节点是与所述第一数据节点具有数据血缘关系的第二数据节点,其中,所述数据血缘关系表用于保存所述多个数据节点的数据血缘关系;
若查询到至少一个所述第二数据节点时,为各个所述第二数据节点添加对应的节点标记;
在检测到未添加节点标记的第三数据节点时,对所述第三数据节点进行清理。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从结构化查询语言SQL代码信息和日志信息中获取各个数据节点之间的数据血缘关系,所述数据血缘关系用于表征各个数据节点之间的上下游关系;
根据所述各个数据节点之间的数据血缘关系更新用于保存所述数据血缘关系的数据血缘关系表。
3.根据权利要求1所述的方法,其特征在于,为所述业务信息对应的第一数据节点添加对应的节点标记,包括:
确定所述业务信息对应的至少一个第一数据节点;
为各个所述第一数据节点添加对应的节点标记。
4.根据权利要求1所述的方法,其特征在于,所述在检测到未添加节点标记的第三数据节点时,对所述第三数据节点进行清理,包括:
检测所述数据库中是否包括未添加节点标记的第三数据节点;
若检测到至少一个所述第三数据节点时,删除各个所述第三数据节点,以及释放各个所述第三数据节点所占用的存储空间。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述对应的节点标记包括对应的业务标识和对应的分类标识中的至少一种。
6.根据权利要求5所述的方法,其特征在于,所述对应的节点标记还包括:业务等级;其中,所述第一数据节点对应的业务等级和所述第二数据节点对应的业务等级相同。
7.一种数据清理装置,其特征在于,所述装置用于对数据库中的多个数据节点进行处理,其中每个数据节点对应一个数据表,所述装置包括:
第一数据节点处理单元,用于在接收到业务信息时,为所述业务信息对应的第一数据节点添加对应的节点标记;
第二数据节点处理单元,用于在数据血缘关系表中查询到所述第一数据节点时,以所述第一数据节点为起点,查询所述多个数据节点中所述第一数据节点的上游节点,所述上游节点是与所述第一数据节点具有数据血缘关系的第二数据节点,其中,所述数据血缘关系表用于保存所述多个数据节点的数据血缘关系;若查询到至少一个所述第二数据节点时,为各个所述第二数据节点添加对应的节点标记;
第三数据节点清理单元,用于在检测到未添加节点标记的第三数据节点时,对所述第三数据节点进行清理。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
获取单元,用于从SQL代码信息和日志信息中获取各个数据节点之间的数据血缘关系,所述数据血缘关系用于表征各个数据节点之间的上下游关系;
更新单元,用于根据所述各个数据节点之间的数据血缘关系更新用于保存所述数据血缘关系的数据血缘关系表。
9.根据权利要求7所述的装置,其特征在于,所述第一数据节点处理单元包括:
确定子单元,用于在接收到业务信息时,确定所述业务信息对应的至少一个第一数据节点;
第一添加子单元,用于为各个所述第一数据节点添加对应的节点标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610710396.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于移动终端的图形用户界面
- 下一篇:智能语音控制盒(Toki)
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置