[发明专利]数据库分级分类方法、系统、装置及存储介质有效
申请号: | 202210734483.2 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115168345B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 袁征 | 申请(专利权)人: | 天翼爱音乐文化科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/245;G06F16/248 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑宏谋 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 分级 分类 方法 系统 装置 存储 介质 | ||
本发明公开了一种数据库分级分类方法、系统、装置及存储介质,首先对数据库中数据属性字段对应的数据进行抽取,获得字段信息;根据数据属性字段和字段信息,构建数据库综合信息体;对数据库综合信息体内的字段信息进行数据识别,获得字段信息对应的识别标签;根据识别标签和预设的分级分类关联树,确定字段信息对应的分级分类结果;对分级分类结果进行展示。本申请实施例在对数据库进行分级分类时,考虑到数据库数据的属性信息,在数据库刚上线没有数据值等情况下,能够对数据库中的数据进行有效的分级分类。本方案中抽取部分数据进行数据识别,能够有效解决相关数据中识别海量数据的耗时较长的问题。
技术领域
本申请涉及数据库技术领域,尤其涉及一种数据库分级分类方法、系统、装置及存储介质。
背景技术
随着大数据技术的发展,越来越多的数据被收集起来用于进行大数据分析。为了存储在数据库中的海量数据进行筛选,相关技术主要通过字典、正则匹配、人工标识的方式针对数据库中存储的数据值进行分类分级识别,但是相关技术的方案的准确度和效率都比较底下,难以匹配当前数据量极速增长的现状。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出一种数据库分级分类方法、系统、装置及存储介质。
第一方面,本申请实施例提供了一种数据库分级分类方法,包括:对数据库中数据属性字段对应的数据进行抽取,获得字段信息;根据所述数据属性字段和所述字段信息,构建数据库综合信息体;对所述数据库综合信息体内的所述字段信息进行数据识别,获得所述字段信息对应的识别标签;根据所述识别标签和预设的分级分类关联树,确定所述字段信息对应的分级分类结果;对所述分级分类结果进行展示。
可选地,所述识别标签包括第一标签和第二标签,所述对所述数据库综合信息体内的数据进行数据识别,获得所述字段信息对应的识别标签,包括:将所述字段信息输入字典识别模型进行第一识别,获得所述第一标签;将在所述第一识别中的未识别字段信息输入关键字识别模型中进行第二识别,获得所述第二标签。
可选地,所述识别标签还包括第三标签,所述将所述第一识别中的未识别字段信息输入关键字识别模型中进行第二识别,获得所述第二标签这一步骤之后,还包括:将在所述第二识别中的所述未识别字段信息输入规则识别模型进行第三识别,获得第三标签;其中,所述第三识别包括正向规则匹配和逆向规则匹配。
可选地,所述识别标签还包括第四标签,将在所述第二识别中的未识别字段信息输入规则识别模型进行第三识别,获得第三标签这一步骤之后,还包括:将在所述第三识别中的所述未识别字段信息进行聚类,确定多组字段信息簇;其中,所述字段信息簇中包含多个所述字段信息;对所述字段信息簇的聚类中心进行人工识别,确定所述字段信息簇中所有字段信息对应的第四标签。
可选地,所述对所述数据库综合信息体内的所述字段信息进行数据识别,获得所述字段信息对应的识别标签,包括:根据所述识别过程中的命中频率和所述所述识别标签的权重,确定各个识别过程的置信度;根据所述置信度,确定需要进行下一阶段识别的所述未识别字段信息。
可选地,所述方法还包括:根据所述分级分类结果配置安全存储策略;根据所述安全存储策略,确定数据库中的敏感分级分类;对所述敏感分级分类进行安全处理;其中,所述安全处理包括定时扫描、数据加密和数据脱敏;完成安全处理后,输出稽核报告。
可选地,所述方法还包括:存储所述敏感分级分类的访问记录;限制所述敏感分级分类的访问权限;存储所述敏感分级分类的数据的流向路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼爱音乐文化科技有限公司,未经天翼爱音乐文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210734483.2/2.html,转载请声明来源钻瓜专利网。