[发明专利]基于口令内部语义驱动的Markov口令恢复方法有效
申请号: | 202110071385.0 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112861528B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 韩伟力;徐铭;张俊杰;俞继涛;黄一力 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 口令 内部 语义 驱动 markov 恢复 方法 | ||
本发明属于系统安全技术领域,具体为一种基于口令内部语义驱动的Markov口令恢复方法。本发明方法包括:使用口令专用分词方法将口令分成更小的组成单元;使用分词后的口令构建、并训练Markov口令恢复模型;基于训练后的口令恢复模型生成概率降序排序的候选口令。本发明通过提取明文口令数据集中频度较高的字符串作为口令的基本组成单元,并利用这些组成单元的转移概率构建Markov口令恢复模型。本发明的优点在于,实现了变长适中粒度的口令恢复模型,根据口令专用的分词方法能自动捕捉口令的高频字符串,可以更好的对口令内部规律建模并实现一个高效的恢复模型。
技术领域
本发明属于系统安全技术领域,具体涉及基于口令内部语义驱动的Markov口令恢复方法。
背景技术
文本口令仍然是大多数实际应用程序身份验证机制的主要选择,比如电子邮件系统和网上银行系统。尽管已经有人提出了各种不同的身份验证方法(例如,生物认证),但文本口令仍然被广泛使用。为了方便记忆,用户倾向于选择语义相关的口令,例如含有自然语言词组的口令短语。然而在真实的口令创建场景中,用户更喜欢遵循特定的习惯模式来创建密码以便于记忆和输入。我们将与自然语言相关的语义称为外部语义,将符合用户习惯的模型称为内部语义。这些口令的内部语义通常是平衡复杂的口令创建策略以及可记忆性而导致的,例如转换规则、键盘模式、字符或电话号码的发音等等。口令中一个广泛使用的技巧是转换规则,比如使用“p@ssw0rd”替换“password”。这种规则不能被自然语言解析算法所捕捉到。虽然上述提到的口令很受欢迎(即“p@ssw0rd”在每个数据集中几乎排名前500名),但目前却很少有文献调研分析这种内部语义。
目前的工作都集中在分析外部语义而忽略了内部语义,这导致(1)口令分词不正确。(2)当前基于数据驱动的口令恢复模型也由于缺乏对内部语义的理解而受到限制。Markov模型(也称为n-gram模型)模型是代表性的数据驱动的恢复模型。该模型都试图估计一组观测到的口令背后的概率分布,并用于生成候选口令,执行猜测攻击。然而,先前的工作大都采用的是基于字符级的Markov模型,存在粒度过细的问题。该模型捕获字符级别信息,其中字符级别粒度过细,而另一种基于上下文无关的猜测方法中使用的模板级粒度又过粗,这在一定程度上限制了口令猜测的发展。一个变长的适中粒度的口令恢复模型将综合各方优势,提供更好的恢复效果。
发明内容
本发明的目的在于提供一种基于口令内部语义驱动的Markov口令恢复方法,以提高口令恢复模型恢复效率。
传统的Markov方法是基于字符级别的,存在粒度太细的问题,本发明首先提出口令专用的分词方法PwdSegment,将口令分词为较小的符合用户模式的记忆单元,进而理解口令内部语义,同时基于PwdSegment分词的结果,提出粒度适中的口令恢复方法(Subword-level Markov,也叫SWL_markov)。
本发明提出的口令专用的分词工具,是利用BPE算法,构建一个基于口令数据集的分词词典,可以通过不同的超参数合并次数(merge operation)自动将口令按照出现的频度分词。
与其他口令分词方法不同的是,本发明提出的口令专用分词工具可以基于频度更好地对口令分词,使得分词结果更符合用户内部语义。传统的方法大都基于自然语言的词典对口令分词,无法捕捉基于用户习惯的记忆单元,例如,口令“p@ssw0rd”只能分割为“p”、“@”、“ssw”、“0”、“rd”,这显然不是很好的分词结果。而因为该种类型出现的频度较高,可以被我们的专用分词更好地将该口令分解为“p@ss”和“w0rd”。与其他的口令恢复方法不同的是,本发明提出的subword-level的口令恢复模型,能够更好的捕捉口令中的带有内部语义的subwords,更好地猜测口令。
本发明提出的基于口令内部语义驱动的Markov口令恢复方法,采用内部语义分词后构建的模型,具体步骤为:
步骤一、使用口令专用分词方法(PwdSegment)将口令分成更小的组成单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110071385.0/2.html,转载请声明来源钻瓜专利网。