[发明专利]一种基于改进随机森林算法的分组密码体制识别方法有效

申请号：	202011406581.0	申请日：	2020-12-04
公开（公告）号：	CN112702157B	公开（公告）日：	2022-05-24
发明（设计）人：	袁科;黄雅冰;李家保;周素芳;杜展飞;张文超;戴琦	申请（专利权）人：	河南大学
主分类号：	H04L9/06	分类号：	H04L9/06;G06K9/62
代理公司：	郑州大通专利商标代理有限公司 41111	代理人：	张立强
地址：	475001 河***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于改进随机森林算法分组密码体制识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于改进随机森林算法的分组密码体制识别方法，其特征在于，包括：

步骤1、基于随机性检测方法对已知对应分组密码体制的一组密文文件F₁，F₂，...，F_n的内容进行密文特征提取，得到一组特征集其中任一密文特征均是维数为d的向量，i＝1,2,…,n，d为特征维数；

步骤2、根据所述特征集Fea^F构建一组基分类器，通过对每个基分类器的预测进行投票以进行分类，得到随机森林模型，然后利用随机森林模型学习到的树构造新特征集；具体包括：

步骤2.1：将步骤1中的n个密文文件的分组密码体制标签形成一个n维向量Lab＝(lab₁，lab₂，...，lab_n)，记由Fea^F和Lab组成的二元组为原始数据集T；

步骤2.2：设定随机森林中树的数量为k，并将原始数据集T作为输入；其中，每个密文文件的密文特征表示一个样本；

步骤2.3：采用有放回取样，随机在原始数据集T中抽取M个样本，形成Bootstrap样本集T*；

步骤2.4：在Bootstrap样本集T*中随机地从d个特征中选取m个属性作为候选属性，并计算最佳分裂属性；

步骤2.5：基于最佳分裂属性的每种取值类型，对本次放回抽样所产生的样本集T*进行水平分割得到数据集P₁，P₂，...，P_j；

步骤2.6：对数据集P₁，P₂，...，P_j中的每个子数据集，随机选取m个属性，并从中选取最佳分裂属性，然后再次水平分割当前子数据集；

步骤2.7：重复步骤2.3至步骤2.6以建立k棵决策树，构建得到随机森林模型，进而利用所述随机森林模型得到分类数据集D(R(P₁),R(P₂),…,R(P_j))；

步骤2.8：根据特征的重要性对所述分类数据集D(R(P₁),R(P₂),…,R(P_j))中的特征进行排序，并筛选出重要性强的特征组成新特征集F(P₁,P₂,…,P_j)；

步骤3、对所述新特征集中的特征进行one-hot编码；

步骤4、采用逻辑回归算法对编码后的新特征集进行分类训练，得到训练好的分类模型；

步骤5、基于随机性检测方法对待识别密文文件FT₁,FT₂,...,FT_s的内容进行特征提取，得到特征集将特征集输入到训练好的分类模型中，输出的识别结果即为所述待识别密文文件的分组密码体制标签。

2.根据权利要求1所述的方法，其特征在于，待识别密文文件的分组密码体制包括AES、3DES、Blowfish、CAST和RC2中的至少一种。

3.根据权利要求1所述的方法，其特征在于，将所述特征集Fea^F和Fea^FT中的密文特征表示为如公式(1)所示的四元组：

fea＝(C，orga，NIST，d), (1)

其中，C为密文数据的表示方式，为SP 800-22标准中的15种随机性测试程序，orga为nist_t要求的密文数据组织形式，t＝1,2,3,…,15。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河南大学，未经河南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011406581.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载