[发明专利]一种基于人工智能的核心数据轨迹画像生成方法及系统有效
申请号: | 202110328733.8 | 申请日: | 2021-03-27 |
公开(公告)号: | CN112711768B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 王文宇 | 申请(专利权)人: | 北京数安行科技有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60 |
代理公司: | 北京大地智谷知识产权代理事务所(特殊普通合伙) 11957 | 代理人: | 周文谦 |
地址: | 100036 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 核心 数据 轨迹 画像 生成 方法 系统 | ||
本申请公开了一种基于人工智能的核心数据轨迹画像生成方法及系统。管理员通过对样本数据进行人工智能分析得到样本数据特征,并从所述样本数据特征中选出预置数据特征,所述样本数据包括结构化数据、半结构化数据以及非结构化数据,所述预置数据特征用于表示核心数据的数据特征;在通过所述预置数据特征确定目标数据为核心数据的情况下,在所述目标数据被使用的过程中,记录所述目标数据的标注数据,并生成对应的轨迹记录;获取标注数据的所有轨迹记录,按时序建立标注数据的轨迹画像。本申请解决了相关技术中不能对数据流动过程进行整体的轨迹画像的技术问题。
技术领域
本申请涉及信息安全领域,具体而言,涉及一种基于人工智能的核心数据轨迹画像生成方法及系统。
背景技术
在传统的企业中,数据的使用频率较低,数据的流动范围较小,使用数据业务不多,因此,接触数据的员工时长局限于特定的范围中,企业管理者对数据的管控方式相对简单,比如通过防火墙类、数据库类、加密类、DLP类等传统安全手段保护。
传统安全手段重在边界防护或者静态存储防护,没有对数据流动过程进行整体的轨迹画像,企业管理者要获得数据的流动视图,并没有有效的手段。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种基于人工智能的核心数据轨迹画像生成方法及系统,以至少解决相关技术中不能对数据流动过程进行整体的轨迹画像的技术问题。
根据本申请实施例的一个方面,提供了一种基于人工智能的核心数据轨迹画像生成方法,包括:1)管理员通过人工智能分析样本数据(此处的管理员人工执行的过程可以通过机器自动运行来替代,下文提及的管理员人工执行的过程同样也可通过机器自动运行来替代),获得样本数据特征,样本数据的格式包括但不限于结构化数据、半结构化数据、非结构化数据;对样本数据的人工智能分析包括基础内容分析、主题分析、语义分析、社会分类分析、用户自定义分类分析;2)管理员选择样本数据特征,所选择的样本数据特征作为预置数据特征;3)对于用户所关注的目标数据,将目标数据的数据特征与预置数据特征进行对比,识别目标数据是否是核心数据,其中,目标数据支持所有格式,包括但不限于结构化数据、半结构化数据、非结构化数据;所操作数据支持所有形态,包括但不限于数据流形态、数据片段形态以及文档的形态;4)用户改变标注数据的形态,获得数据标注的内容,并进一步获得标注信息,产生标注数据的轨迹记录。其中,改变标注数据的形态,包括但不限于数据在结构化数据、半结构化数据、非结构化数据之间的改变;数据由文档形态转为数据流、数据片段的形态;数据由一种文档形态转存为另外一种或多种文档形态;数据由一种文档形态多次连续转存为其他多种文档形态(多次连续转存为其他多种文档形态可以为每次转存为一种文档形态,连续两次转存的形态不同);5)用户删除标注数据或恢复已删除的标注数据,获得数据标注的内容,产生标注数据的轨迹记录;6)用户转存标注数据,获得数据标注的内容,产生标注数据的轨迹记录。其中,用户转存标注数据的形态,包括但不限于对数据流或数据片段形态的标注数据的转存;对文档形态的标注数据的转存;用户转移标注数据的方式,包括但不限于在不同应用空间的内存之间的转移以及存储介质之间(如内存与其他存储介质)的转移;7)标注数据在互联网中传播,获得数据标注的内容,产生标注数据的轨迹记录;8)标注数据的所有轨迹记录,按时序建立标注数据的轨迹画像。
可选地,人工智能分析,包含样本数据的基础内容分析,主题分析,语义分析,社会分类分析,用户自定义分类分析。
可选地,数据特征,包含数据的基础内容特征,主题,语义,社会分类和用户自定义分类。
可选地,样本数据特征,按照如下方法获取:1)管理员选择样本数据,样本数据包括结构化数据,半结构化数据,非结构化数据;2)通过人工智能分析样本数据,获得样本数据特征;3)管理员继续选择新的样本数据;4)通过人工智能分析样本数据,增量获得样本数据特征。
可选地,预置数据特征包括对样本数据特征择取、组合,以获得的预置数据特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数安行科技有限公司,未经北京数安行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110328733.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置