[发明专利]一种基于改进随机森林算法的分组密码体制识别方法有效
申请号: | 202011406581.0 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112702157B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 袁科;黄雅冰;李家保;周素芳;杜展飞;张文超;戴琦 | 申请(专利权)人: | 河南大学 |
主分类号: | H04L9/06 | 分类号: | H04L9/06;G06K9/62 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 张立强 |
地址: | 475001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 随机 森林 算法 分组 密码 体制 识别 方法 | ||
1.一种基于改进随机森林算法的分组密码体制识别方法,其特征在于,包括:
步骤1、基于随机性检测方法对已知对应分组密码体制的一组密文文件F1,F2,...,Fn的内容进行密文特征提取,得到一组特征集其中任一密文特征均是维数为d的向量,i=1,2,…,n,d为特征维数;
步骤2、根据所述特征集FeaF构建一组基分类器,通过对每个基分类器的预测进行投票以进行分类,得到随机森林模型,然后利用随机森林模型学习到的树构造新特征集;具体包括:
步骤2.1:将步骤1中的n个密文文件的分组密码体制标签形成一个n维向量Lab=(lab1,lab2,...,labn),记由FeaF和Lab组成的二元组为原始数据集T;
步骤2.2:设定随机森林中树的数量为k,并将原始数据集T作为输入;其中,每个密文文件的密文特征表示一个样本;
步骤2.3:采用有放回取样,随机在原始数据集T中抽取M个样本,形成Bootstrap样本集T*;
步骤2.4:在Bootstrap样本集T*中随机地从d个特征中选取m个属性作为候选属性,并计算最佳分裂属性;
步骤2.5:基于最佳分裂属性的每种取值类型,对本次放回抽样所产生的样本集T*进行水平分割得到数据集P1,P2,...,Pj;
步骤2.6:对数据集P1,P2,...,Pj中的每个子数据集,随机选取m个属性,并从中选取最佳分裂属性,然后再次水平分割当前子数据集;
步骤2.7:重复步骤2.3至步骤2.6以建立k棵决策树,构建得到随机森林模型,进而利用所述随机森林模型得到分类数据集D(R(P1),R(P2),…,R(Pj));
步骤2.8:根据特征的重要性对所述分类数据集D(R(P1),R(P2),…,R(Pj))中的特征进行排序,并筛选出重要性强的特征组成新特征集F(P1,P2,…,Pj);
步骤3、对所述新特征集中的特征进行one-hot编码;
步骤4、采用逻辑回归算法对编码后的新特征集进行分类训练,得到训练好的分类模型;
步骤5、基于随机性检测方法对待识别密文文件FT1,FT2,...,FTs的内容进行特征提取,得到特征集将特征集输入到训练好的分类模型中,输出的识别结果即为所述待识别密文文件的分组密码体制标签。
2.根据权利要求1所述的方法,其特征在于,待识别密文文件的分组密码体制包括AES、3DES、Blowfish、CAST和RC2中的至少一种。
3.根据权利要求1所述的方法,其特征在于,将所述特征集FeaF和FeaFT中的密文特征表示为如公式(1)所示的四元组:
fea=(C,orga,NIST,d), (1)
其中,C为密文数据的表示方式,为SP 800-22标准中的15种随机性测试程序,orga为nistt要求的密文数据组织形式,t=1,2,3,…,15。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011406581.0/1.html,转载请声明来源钻瓜专利网。