[发明专利]基于多任务学习的小样本口令集合猜测方法在审
申请号: | 202210655341.7 | 申请日: | 2022-06-10 |
公开(公告)号: | CN115098848A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 张跃宇;耿宇;王宁;李赓;李晖;曹进;王勇 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F21/45 | 分类号: | G06F21/45;G06N3/08 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 王海栋 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 学习 样本 口令 集合 猜测 方法 | ||
本发明公开了一种基于多任务学习的小样本口令集合猜测方法,包括:对目标小样本口令集合和辅助训练口令集合进行预处理,获得每个口令集合的口令结构集合和数据段集合;构建多任务学习神经网络模型并利用目标小样本口令集合和辅助训练口令集合预处理后的口令结构集合进行多任务学习;利用目标小样本口令集合的口令结构集合对预训练后的神经网络模型进行训练;利用训练后的神经网络模型获得预测的口令结构集合;利用目标小样本口令集合的各数据段集合对预测的口令结构集合进行填充,生成猜测的口令集合。本发明利用多任务学习神经网络模型同时学习不同口令数据集,提高了口令猜测对小样本口令集合的破解率。
技术领域
本发明属于网络安全技术领域,具体涉及一种基于多任务学习的小样本口令集合猜测方法。
背景技术
在整个社会的信息化进程中,互联网将人们生活的方方面面交织在一起,人们的日常生活、资产、个人信息等都被数字化,口令在互联网服务中的应用特别广泛。由于口令数据泄露和计算机计算力增强,口令猜测研究愈发深入,口令安全受到持续性威胁。口令猜测方法的本质是对口令数据集的分析,从统计的角度分析用户构成口令的规律,根据得到的规律猜测更多可能的口令。口令猜测需要分析和研究口令规律,找到安全问题,为指导设置更加安全的口令设置策略、评估口令的安全性提供理论依据。
已有的口令猜测方法大都基于数据驱动,猜测效果取决于训练数据的多少。一般来说,使用越多的口令数据会获得越好的猜测效果。由于不同口令数据集含有不同口令分布,因此大部分的口令猜测方法建立在单个数据集之上。在这种情况下,对在单个口令数据集进行分析的口令猜测方法只能捕获单个口令集合的特征,在进行跨数据集猜测时性能较弱。当猜测的口令集合没有大量的泄露数据或者猜测非传统口令策略产生的口令时,样本的稀疏性限制了数据密集型猜测方法的有效性。因此对一个小样本口令集合的口令猜测算法是一个有实用价值的研究方向,它解决了不能跨数据集训练、过度依赖单个数据集的问题,应用于对一个小样本口令集合的猜测,提高了对小样本口令集合的破解率。
Weir等人在文献“Password cracking using proba-bilistic context-freegrammars[C]//2009 30th IEEE Symposium on Security and Privacy.IEEE,2009:391-405”中提出一种基于概率上下文无关文法(Probabilistic Context-Free Grammars,PCFG)的口令猜测方法。PCFG方法被提出的基础是,口令研究显示用户在设置口令时对某些口令结构和分段内容具有偏好,有一些很常见的口令结构,比如长度为6的数字字符串。因此PCFG方法将口令抽象化为口令结构,并统计口令中常见的口令结构,在猜测口令时首先选择出现概率最大的口令结构进行填充,在猜测初期可以达到很好的效果。
PCFG方法使用统计学中的上下文无关文法对口令进行建模,需要来自目标数据集的大量数据才能得到较为准确的分布,因此当猜测的目标小样本口令集合没有大量的泄漏数据、猜测非传统口令策略产生的口令或猜测的目标口令集的样本数量少时,样本的稀疏性限制了数据密集型方法的有效性。另外,由于不同口令集合的口令分布不同,PCFG方法猜测某个口令集合时难以借助其它口令集合的信息,因此PCFG方法在猜测小样本口令集合时性能下降。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于多任务学习的小样本口令集合猜测方法。本发明要解决的技术问题通过以下技术方案实现:
本发明的一个方面提供了一种基于多任务学习的小样本口令集合猜测方法,包括:
对目标小样本口令集合和辅助训练口令集合进行预处理,获得每个口令集合的口令结构集合、字母段集合、字母段掩码集合、数字段集合以及特殊字符段集合,所述辅助训练口令集合与所述目标小样本口令集合来自不同的口令集合;
构建多任务学习神经网络模型,利用目标小样本口令集合和辅助训练口令集合预处理后的口令结构集合对所述多任务学习神经网络模型进行多任务学习,得到预训练后的神经网络模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210655341.7/2.html,转载请声明来源钻瓜专利网。