[发明专利]一种基于改进随机森林算法的分组密码体制识别方法有效

专利信息
申请号: 202011406581.0 申请日: 2020-12-04
公开(公告)号: CN112702157B 公开(公告)日: 2022-05-24
发明(设计)人: 袁科;黄雅冰;李家保;周素芳;杜展飞;张文超;戴琦 申请(专利权)人: 河南大学
主分类号: H04L9/06 分类号: H04L9/06;G06K9/62
代理公司: 郑州大通专利商标代理有限公司 41111 代理人: 张立强
地址: 475001 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 随机 森林 算法 分组 密码 体制 识别 方法
【权利要求书】:

1.一种基于改进随机森林算法的分组密码体制识别方法,其特征在于,包括:

步骤1、基于随机性检测方法对已知对应分组密码体制的一组密文文件F1,F2,...,Fn的内容进行密文特征提取,得到一组特征集其中任一密文特征均是维数为d的向量,i=1,2,…,n,d为特征维数;

步骤2、根据所述特征集FeaF构建一组基分类器,通过对每个基分类器的预测进行投票以进行分类,得到随机森林模型,然后利用随机森林模型学习到的树构造新特征集;具体包括:

步骤2.1:将步骤1中的n个密文文件的分组密码体制标签形成一个n维向量Lab=(lab1,lab2,...,labn),记由FeaF和Lab组成的二元组为原始数据集T;

步骤2.2:设定随机森林中树的数量为k,并将原始数据集T作为输入;其中,每个密文文件的密文特征表示一个样本;

步骤2.3:采用有放回取样,随机在原始数据集T中抽取M个样本,形成Bootstrap样本集T*;

步骤2.4:在Bootstrap样本集T*中随机地从d个特征中选取m个属性作为候选属性,并计算最佳分裂属性;

步骤2.5:基于最佳分裂属性的每种取值类型,对本次放回抽样所产生的样本集T*进行水平分割得到数据集P1,P2,...,Pj

步骤2.6:对数据集P1,P2,...,Pj中的每个子数据集,随机选取m个属性,并从中选取最佳分裂属性,然后再次水平分割当前子数据集;

步骤2.7:重复步骤2.3至步骤2.6以建立k棵决策树,构建得到随机森林模型,进而利用所述随机森林模型得到分类数据集D(R(P1),R(P2),…,R(Pj));

步骤2.8:根据特征的重要性对所述分类数据集D(R(P1),R(P2),…,R(Pj))中的特征进行排序,并筛选出重要性强的特征组成新特征集F(P1,P2,…,Pj);

步骤3、对所述新特征集中的特征进行one-hot编码;

步骤4、采用逻辑回归算法对编码后的新特征集进行分类训练,得到训练好的分类模型;

步骤5、基于随机性检测方法对待识别密文文件FT1,FT2,...,FTs的内容进行特征提取,得到特征集将特征集输入到训练好的分类模型中,输出的识别结果即为所述待识别密文文件的分组密码体制标签。

2.根据权利要求1所述的方法,其特征在于,待识别密文文件的分组密码体制包括AES、3DES、Blowfish、CAST和RC2中的至少一种。

3.根据权利要求1所述的方法,其特征在于,将所述特征集FeaF和FeaFT中的密文特征表示为如公式(1)所示的四元组:

fea=(C,orga,NIST,d), (1)

其中,C为密文数据的表示方式,为SP 800-22标准中的15种随机性测试程序,orga为nistt要求的密文数据组织形式,t=1,2,3,…,15。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011406581.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top