[发明专利]一种参数化混合模型的口令猜测方法有效
申请号: | 202110026552.X | 申请日: | 2021-01-08 |
公开(公告)号: | CN112861113B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 韩伟力;张俊杰;徐铭 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F21/45 | 分类号: | G06F21/45 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 参数 混合 模型 口令 猜测 方法 | ||
1. 一种参数化混合模型的口令猜测方法,其特征在于,具体步骤如下:
步骤一、利用训练集生成优化的PCFG和Markov口令猜测模型
利用输入的训练集全集对优化的PCFG模型进行训练,并过滤得到的口令结构;利用输入的训练集中一类字符构成的口令对Markov模型进行训练;
步骤二、根据最优的参数化策略,分配口令猜测数
根据输入的总猜测数以及训练集中的一类字符构成的口令所占的比例,计算得到Markov模型的分配猜测数,并将剩下的分配猜测数作为优化的PCFG模型的分配猜测数;
步骤三、根据分配的猜测数生成备选口令集
利用训练好的优化PCFG和Markov口令猜测模型,以及为两者分配的猜测数,分别生成两类及以上字符构成的备选口令集和一类字符构成的备选口令集,最终两者合并得到输入的总猜测数规模的备选口令集。
2.根据权利要求1所述的参数化混合模型的口令猜测方法,其特征在于,所述优化的PCFG为综合PCFGv4.1和语义PCFG的方法,综合的是两者针对口令中的连续英文字母片段的分词处理,具体分为以下步骤:
(1)对连续的英文字母片段使用PCFGv4.1进行分词,得到分词后的一段或多段英文字母片段;对同样的连续的英文字母片段也使用语义PCFG进行分词,得到分词后的一段或多段英文字母片段;
(2)针对上述结果进行权衡以选择更优的分词结果:
如果PCFGv4.1分词结果仅有一段,而语义PCFG分词结果有多段,选择分出的单词在训练集中出现的平均频度更高的分词结果;
如果PCFGv4.1分词结果有多段,而语义PCFG分词结果仅有一段,检查原英文字母片段是否在英文常用词字典中,如果在,使用语义PCFG的分词结果,反之使用PCFGv4.1的分词结果;
如果PCFGv4.1分词结果有多段,而语义PCFG分词结果也有多段,但两者的内容不一样,选择分出的单词在训练集中出现的平均频度更高的分词结果。
3. 根据权利要求1所述的参数化混合模型的口令猜测方法,其特征在于,所使用的Markov为4-gram Markov,即使用字符串中前3个出现的字符来预测下一个出现字符概率的Markov模型。
4.根据权利要求1所述的参数化混合模型的口令猜测方法,其特征在于,步骤一中所述训练优化的PCFG模型时的结构过滤操作,具体为:
由于优化的PCFG模型在表示结构时沿用PCFGv4.1使用的6种字符:“A”、“D”、“O”、“Y”、“K”和“X”;其中“A”表示英文字母,“D”表示数字,“O”表示特殊符号;“Y”表示年份模式,由纯数字构成;“K”表示键盘模式,由两类及以上字符构成;“X”表示上下文模式,也由两类及以上字符构成;
需要过滤的是由一类字符构成的口令训练得到的结构,此结构所表示的字符种类只有一种;结合表示结构的6种字符的含义,需要过滤的结构是:
由“A”构成的结构、由“D”构成的结构、由“O”构成的结构、由“Y”构成的结构以及由“D”和“Y”构成的结构。
5.根据权利要求1所述的参数化混合模型的口令猜测方法,其特征在于,步骤二中所述分配猜测数的最优参数化策略,具体分为如下步骤:
(1)统计训练集中一类字符即不区分大小写的英文字母、数字或者特殊符号构成的口令的数量以及训练集中两类及以上字符构成的口令的总数,用一类口令的数量除以两类及以上字符构成的口令的数量得到比值;
(2)将比值开1.2次方的结果记为,用的值乘以总猜测数,得到4-gram Markov的分配猜测数;用总猜测数减去4-gram Markov的分配猜测数,得到优化的PCFG模型的分配猜测数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110026552.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:陶瓷线路板及其制作方法
- 下一篇:一种低成本测试模拟数字转换器线性度的方法