[发明专利]基于LightGBM的关键信息基础设施类型单位归属判定方法有效
申请号: | 201910459822.9 | 申请日: | 2019-05-30 |
公开(公告)号: | CN110334904B | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | 潘丽敏;陈传涛;罗森林;门元昊;秦枭喃 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F16/84 | 分类号: | G06F16/84 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于LightGBM的关键信息基础设施类型单位归属判定方法,属于网络空间安全与机器学习领域。主要为了解决传统的依赖人力对关键信息基础设施类型进行标注的效率低、可扩展性差的问题。本发明提出一种基于机器学习算法,结合多类型、多截面数据采集及特征表达的关键信息基础设施资产特征优化表达与多目标分类技术研究方法,在此基础上构建关键信息基础设施类型归属判别应用系统,根据设施资产数据判定其属于哪一类的关键信息基础设施(如政府机关、国防科工、广播电台、运营商等等),实现对关键信息基础设施类型归属的识别认定。实验结果表明,本发明提出的算法的准确率和查全率较好,与规则匹配方法相比,具有很好的判定效果。 | ||
搜索关键词: | 基于 lightgbm 关键 信息 基础设施 类型 单位 归属 判定 方法 | ||
【主权项】:
1.基于LightGBM的关键信息基础设施类型单位归属判定方法,其特征在于所述方法包括如下步骤:步骤1,对关键信息基础设施的设备日志、网络流量等复杂原始数据进行特征优化表达和特征构建;步骤1.1,对关键信息基础设施的结构化与非机构化数据进行清洗优化获得原始资产数据;步骤1.2,然后结合专家经验和《关键信息基础设施确定指南》,基于原始资产数据采用特征分割与融合的方法从关键字、时段节点、行为组合、地理关联四个方面构建特征,并进行归一化、标准化和哑变量处理获得关键词特征向量、时段特征向量、行为特征向量和地理特征向量;步骤1.3,通过归一化、标准化和哑变量处理获得关键词特征向量、时段特征向量、行为特征向量和地理特征向量,并顺序拼接获得高维扩展特征向量;步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成分分析法,进行关键信息基础设施的关键影响因素分析,提取关键特征向量;步骤2.1,在客观上基于LightGBM机器学习的方法获得特征的权重集Weight(N)={w1,w2,…wk…,wN},其中wk表示第k个特征的权重大小,wk∈[0,1];步骤2.2,获取所有特征的权重信息后,基于德尔菲专家咨询法原则,对N个特征进行多轮经验分析,得到特征的重要性权重集Votes(N)={v1,v2,…vk…,vN};步骤2.3,结合专家经验与机器学习方法得到的客观影响因素分析,计算Importance(N)={w1*v1,w2*v2,…wk*vk…,wN*vN},进行关键影响因素提取,剔除掉非法特征和混淆特征,重点保留关键特征信息,获得最终的关键特征向量;步骤3,通过二元码拆解策略,设立编码规则将政府机关、国防科工等多个类别及其子类进行编码规则的设定,将多分类任务划分为多个二分类任务实现细粒度分类,结合LightGBM梯度提升算法构建多个二分类模型,并通过计算多个模型结果的编码相似度,对关键信息基础设施的类型归属进行判定;步骤3.1,依据二元码拆分策略,设立编码规则将政府机关、国防科工、广播电台、高校网、运营商、云计算平台及其下属的子类的多分类任务划分多个二分类任务,其编码的规则为将每个资产类型作为一个二元码,1表示是,0表示否,则多种资产类型组成的码元序列,即为一条二元码编码,所有编码的集合即是二元码编码空间;步骤3.2,并结合机器学习中轻量级梯度提升算法的LightGBM框架,进行模型训练获得多个二分类模型,分别对位置一条样本进行预测,得到多个判定结果,组成预测编码;步骤3.3,设定相似度计算预测编码与二元码编码空间内所有编码的相似度,选取编码相似度最大的标签作为判定结果,实现对未知的关键信息基础设施进行类型归属的识别判定。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910459822.9/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置