[发明专利]面向保密需求的海洋大数据敏感度评估系统及防范方法有效
申请号: | 201910060928.1 | 申请日: | 2019-01-23 |
公开(公告)号: | CN109800600B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 王晓东;罗祥裕;解玮玮;魏志强;王雪 | 申请(专利权)人: | 中国海洋大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 张慧芳 |
地址: | 266100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 保密 需求 海洋 数据 敏感度 评估 系统 防范 方法 | ||
本发明公开了一种面向保密需求的海洋大数据敏感度评估系统及防范方法,包括以下步骤:步骤一、建立敏感特征库;步骤二、匹配分析待处理数据集;步骤三:构建敏感度评估模型;步骤四:计算属性敏感度;步骤五:保护敏感数据;步骤六:动态优化敏感特征库。用于实现来源于各类海洋业务系统、不同数据敏感度、价值密集度涉海数据的识别与保护。
技术领域
本发明属于数据识别处理技术领域,特别涉及一种面向保密需求的海洋大数据敏感度评估系统及防范方法。
背景技术
数据是组织、企业和个人的重要资产,数据泄露对数据拥有者造成极大的损失。近年来,数据泄露更是成了信息贩卖黑色产业链的源泉。大数据环境下敏感数据的安全保护具有极高的理论研究价值和工程实践意义,如何保护敏感数据,已经成为大数据安全关注的重点。
现有技术对数据进行保护时大多采用:访问控制、基于数据失真的敏感数据保密技术(保留某些统计特征)、数据加密、限制发布(不发布数据中的某些属性)。关于敏感数据保护技术大都是直接对敏感数据处理,并未考虑到如何发现敏感数据。而已有的敏感数据评估方法主要依赖于专家事先定义,无法验证其准确性,也无法满足动态数据的敏感度评估需求。先行信息安全标准并没有设计提出一个全面计算数据敏感度的方法。
其次,目前的研究集中于通用大数据,针对海洋数据的专门研究仍处于起步阶段。针对海洋数据多元、多类、多模态、时空性的特点,如何发现识别海洋敏感数据,尚需要我们进行深入、系统的科学研究。根据海洋工作中国家秘密及其密级具体范围的规定,海洋秘密主要包括相关海洋调查成果、方案,重要方针、政策,敏感区域原始数据等。其中,内部方案、对策、材料多为文本数据,原始调查数据为数值型数据。文本数据是在原始数据的基础上经过人类脑力活动,对数据进行加工、处理,产生的有价值的秘密信息。
因此,防止海洋秘密信息泄露的关键是识别发现敏感数据,并根据识别发现的敏感数据特征,采取有针对性的保护措施。
现有技术中,敏感数据识别大多采用字典匹配方法和人工识别方法相结合的方式主要过程如下:用户定义敏感数据模式匹配式,根据预定义的模型确定字典匹配范围,然后使用字典匹配对目标进行匹配扫描,在完成扫描后,通过人工对匹配结果过滤,并对模式数据模式匹配式进行优化。
敏感数据字典匹配方法存在如下缺陷:1、识别精准度低,字典匹配采用的是模式化匹配的方式,因此数据字典的建立决定了敏感数据识别准确度,当字典不完整或者字典建立有误时,会出现识别精度降低的问题;2、分类结果干扰,由于采用字典匹配,因此同一个数据信息会匹配到多个数据字典,由于传统数据字典未能进行加权计算,因此会造成分类结果的干扰,导致分类结果的不准确。
敏感数据人工识别方法存在如下缺陷:1、识别速度慢,由于采用人工处理的方式,在面对大量数据的时候,人工梳理速度相对机器识别速度周期较长,而且对处理人员的专业素质要求较高;2、评判标准不统一,由于敏感数据识别过程主要依赖与人的主观判断,因此不同的人对相同的数据可能会出现不同的评判标准,甚至同一个人在不同时间所识别的结果仍有不同,这就会导致敏感数据识别结果的差异性。
专利号:CN104933443A公开了一种敏感数据自动识别与分类的方法,虽然是对传统字典匹配方法及人工识别方法的改进,在数据字典和匹配规则不完整的情况下进行敏感数据的识别,但是仍存在较多缺陷问题。
其中,步骤一中,通过分词技术对训练数据集进行预处理,从训练数据集中获得词汇集,通过TF-IDF算法获得词权重,从而建立基础语料库。自建语料库可能存在由于训练数据集体量不足导致语料库不够全面的问题。步骤二中,仍然需要通过人工对基础语料库进行敏感特征的识别和分类,存在较大的主观性,不同的人对相同的数据可能会出现不同的评判标准,甚至同一个人在不同时间所识别的结果仍有不同,这会导致敏感数据识别结果的差异性。步骤三中,通过敏感词加权排序得出目标数据的类别,但未量化数据的敏感度。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学,未经中国海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910060928.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种区块链分布式存储方法及系统
- 下一篇:一种基于区块链的互联网实名认证方法