[发明专利]基于口令内部语义驱动的Markov口令恢复方法有效
申请号: | 202110071385.0 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112861528B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 韩伟力;徐铭;张俊杰;俞继涛;黄一力 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 口令 内部 语义 驱动 markov 恢复 方法 | ||
1.一种基于口令内部语义驱动的Markov口令恢复方法,采用内部语义分词后构建的模型,其特征在于,具体步骤为:
步骤一、使用口令专用分词方法PwdSegment将口令分成更小的组成单元;
PwdSegment使用明文口令作为训练BPE模型的语料库,训练BPE模型,在对应的超参数mergeoperation下最终生成高频度的口令子串subwords词典,根据该词典最终将口令分成更小的组成单元;其中,设置超参数合并次数的阈值,根据分词后的平均长度,设置的合并次数在300-1000区间,使得分词后的平均长度在1.2-2.0之间:
步骤二、使用分词后的口令构建SWL_Markov恢复模型;
采用口令分词后的组成单元替代字符构建基于口令字符串的Markov恢复模型,记为SWL_Markov;SWL_Markov模型使用分词后的subwords计算口令中subwords之间的转移概率,即口令中的subword出现的概率仅仅和前面的n个subwords相关,即n阶SWL_Markov;SWL_Markov模型计算口令中subwords之间的转移概率:
步骤三、生成候选口令
基于步骤二中的SWL_Markov模型,生成概率降序排列的候选口令;该候选口令可与待猜测口令匹配,如果匹配成功,即候选口令为恢复的口令;
步骤一的具体流程为:
(1)口令数据预处理
预处理包括口令频率统计以及口令在字符级上的分解;首先对数据集中出现的所有口令统计其出现频率;将每个口令分解为组成口令的字符序列,同时在结尾字符加上“w”作为结束符;
(2)合并操作
迭代合并出现频率最高的字符对:把出现频率最高的两个字符合并为一个新的字符串,新生成的字符串将按照单个字符对待;
(3)生成分词词典
重复流程(2),直到合并次数达到步骤一设定的合并次数阈值或者剩余所有的字符对只出现一次;最终,BPE算法生成一个口令分词词典,其中既包含字符串,也包含单个字符;
(4)分解口令
根据生成的口令分词词典对口令进行分词,即口令根据分词词典中的分词分解为更细粒度的组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110071385.0/1.html,转载请声明来源钻瓜专利网。