[发明专利]一种基于机器学习的文件分类管理方法及系统有效
申请号: | 201910875130.2 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110727643B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 高志勇;喻波;王志海;李永刚;安鹏 | 申请(专利权)人: | 北京明朝万达科技股份有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F21/62;G06K9/62;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100097 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于机器学习的文件分类管理方法及系统,所述系统包括:第三方业务系统、智能分类分级系统、数据文件存储系统、数据文件使用方系统。所述智能分类分级系统,扫描监听上传的文件,解析描述文件,利用AI分级分类模块进行分类、分级,对分类分级结果进行加密,进行机器学习,之后进行二次分类、分级,再由所述敏感数据分析及加密模块抓取敏感数据,并对所述敏感数据进行二次加密,将加密后的数据文件上传到数据文件存储系统。根据本发明的方案,能够使数据文件的安全性及使用效率得到保证。数据文件中的数据经过敏感数据分析模块的分析与计算,敏感数据被二次加密,大大增加了企业、单位对数据文件使用的便捷性和安全性。 | ||
搜索关键词: | 一种 基于 机器 学习 文件 分类 管理 方法 系统 | ||
【主权项】:
1.一种基于机器学习的智能分类分级系统,其特征在于,所述智能分类分级系统包括定时扫描模块、文件解压模块、解析文件模块,AI分级分类模块、加密模块、二次分类模块、敏感数据分析及加密模块、文件上传模块、日志模块、机器学习模块;/n所述定时扫描模块实时监听所述第三方业务系统上传的最新数据文件消息,监听到消息后将所述消息发送给所述文件解压模块;/n所述文件解压模块接收到所述定时扫描模块发送的消息,下载压缩文件包并对所述压缩文件包进行解压;/n所述解析文件模块,用于对解压后的所述数据文件进行解析,并提取关键字;/n所述AI分级分类模块,使用智能分类模型进行分级分类;利用所述智能分类模型,基于所述数据文件的文件描述信息及提取到的关键字对所述数据文件进行分级分类;基于分级分类结果,所述智能分类模型进行机器学习;/n所述加密模块用于根据所述数据文件所属的不同密级使用加密算法生成不同密级的加密文件;/n所述二次分类模块使用经过机器学习优化后的智能分类模型并对所述AI分级分类模块的分级分类结果再次进行分级分类;基于分级分类结果,所述智能分类模型进行机器学习;/n所述敏感数据分析及加密模块,使用敏感数据分析模型对所述数据文件进行解析,用于按照特征匹配的方式确定敏感数据并加密所述敏感数据;/n所述文件上传模块用于上传加密文件到所述数据文件存储系统的文件服务器;/n所述日志模块用于记录文件存储情况、敏感数据二次加密情况;/n所述机器学习模块用于对每进行一次所述数据文件处理后得到的分级分类结果作为样本进行机器学习,并优化所述智能分类模型。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明朝万达科技股份有限公司,未经北京明朝万达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910875130.2/,转载请声明来源钻瓜专利网。