[发明专利]基于多任务学习的小样本口令集合猜测方法在审
申请号: | 202210655341.7 | 申请日: | 2022-06-10 |
公开(公告)号: | CN115098848A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 张跃宇;耿宇;王宁;李赓;李晖;曹进;王勇 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F21/45 | 分类号: | G06F21/45;G06N3/08 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 王海栋 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 学习 样本 口令 集合 猜测 方法 | ||
1.一种基于多任务学习的小样本口令集合猜测方法,其特征在于,包括:
对目标小样本口令集合和辅助训练口令集合进行预处理,获得每个口令集合的口令结构集合、字母段集合、字母段掩码集合、数字段集合以及特殊字符段集合,所述辅助训练口令集合与所述目标小样本口令集合来自不同的口令集合;
构建多任务学习神经网络模型,利用目标小样本口令集合和辅助训练口令集合预处理后的口令结构集合对所述多任务学习神经网络模型进行多任务学习,得到预训练后的神经网络模型;
利用所述目标小样本口令集合的口令结构集合对所述预训练后的神经网络模型进行训练,获得训练后的神经网络模型;
利用训练后的神经网络模型获得预测的口令结构集合;
利用目标小样本口令的字母段集合、字母段掩码集合、数字段集合和特殊字符段集合对预测的口令结构集合进行填充,生成猜测的口令集合。
2.根据权利要求1所述的基于多任务学习的小样本口令集合猜测方法,其特征在于,对目标小样本口令集合和辅助训练口令集合进行预处理,包括:
对目标小样本口令集合和辅助训练口令集合中的每个口令进行分段,提取每条口令的分段数据和口令结构,所述分段数据包括每条口令的字母段数据、字母段掩码数据、数字段数据以及特殊字符段数据,所述口令结构包括当前口令所包含分段数据的类型以及分段数据的长度,所述字母段掩码数据用于记录字母段数据的大小写;
为所述目标小样本口令集合和所述辅助训练口令集合分别设置数据存储单元,所述数据存储单元包括口令结构字典、字母段字典、字母段掩码字典、数字段字典以及特殊字符段字典,分别用于存储对应口令集合的字母段数据、字母段掩码数据、数字段数据以及特殊字符段数据及对应的频次,从而形成每个口令集合的口令结构集合、字母段集合、字母段掩码集合、数字段集合以及特殊字符段集合;
利用口令集合的字母段数据、字母段掩码数据、数字段数据以及特殊字符段数据及对应的频次获得字母段数据、字母段掩码数据、数字段数据以及特殊字符段数据的概率。
3.根据权利要求1所述的基于多任务学习的小样本口令集合猜测方法,其特征在于,所述多任务学习神经网络模型包括共享层模块以及分别与所述共享层模块连接的多个特定任务层模块,其中,
所述共享层模块用于捕获口令集合中共享的口令结构知识,所述共享层模块包括一个输入层、两个RNN层、一个Linear层和一个Dropout层,所述输入层的输入为每个口令预处理获得的口令结构的向量形式;
所述特定任务层模块包括两个RNN层、一个Linear层、一个Softmax层以及一个输出层。
4.根据权利要求3所述的基于多任务学习的小样本口令集合猜测方法,其特征在于,在将每个口令预处理获得的口令结构输入到所述共享层模块的输入层之前,包括:
采用独热编码对所述口令结构进行编码,获得口令结构的One-Hot向量形式。
5.根据权利要求3所述的基于多任务学习的小样本口令集合猜测方法,其特征在于,将所述小样本口令集合的任务设置为0号任务,将所述辅助训练口令集合的任务设置为1到n号任务,每个任务的loss函数均一致,在每个任务进行训练时,使用所述共享层模块和所述特定任务层模块前向传播获得预测结果,随后通过梯度反向传播更新所述共享层模块和所述特定任务层模块的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210655341.7/1.html,转载请声明来源钻瓜专利网。