[发明专利]一种批量口令分级先验检验方法有效

专利信息
申请号: 201410460356.3 申请日: 2014-09-11
公开(公告)号: CN104268450B 公开(公告)日: 2017-06-23
发明(设计)人: 沈瑛;廖刘承;董天阳 申请(专利权)人: 浙江工业大学
主分类号: G06F21/31 分类号: G06F21/31;G06F17/30;G06K9/66
代理公司: 杭州天正专利事务所有限公司33201 代理人: 王兵,黄美娟
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 批量口令分级先验检验方法,由两个步骤组成基于真实口令数据的分级与分级口令模型的训练与检索;在分级过程中,先要采样提取百万级的中国用户口令数据,得到样本训练集,然后由样本训练集通过二阶的马尔可夫模型得到口令的概率转移矩阵,并计算得到每个口令的强度评估值,最后按口令评估值和口令分级结构对全体口令数据进行分级;在分级口令模型的训练与检索阶段,通过对每一分级的口令集构建不同强度的口令布鲁姆过滤器,把分级结果通过散列函数组合保存在每一级的布鲁姆过滤器位向量,从而建立分级口令模型;检索时可通过多级的口令布鲁姆过滤器快速且有效判断待测口令的强弱。
搜索关键词: 一种 批量 口令 分级 先验 检验 方法
【主权项】:
批量口令分级先验检验方法,由两个步骤组成:基于真实口令数据的分级与分级口令模型的训练与检索;在分级过程中,先要采样提取百万级的中国用户口令数据,得到样本训练集,然后由样本训练集通过二阶的马尔可夫模型得到口令的概率转移矩阵,并计算得到每个口令的强度评估值,最后按口令评估值和口令分级结构对全体口令数据进行分级;在分级口令模型的训练与检索阶段,通过对每一分级的口令集构建不同强度的口令布鲁姆过滤器,把分级结果通过散列函数组合保存在每一级的布鲁姆过滤器位向量中,从而建立分级口令模型;检索时可通过多级的口令布鲁姆过滤器快速且有效判断待测口令的强弱;详细步骤如下:1.基于真实口令数据分级;首先需要选定马尔可夫模型的口令数据训练样本集,先对大量的口令数据进行随机抽样得到训练样本,然后借助二阶马尔可夫模型计算得到口令数据总体的概率转移矩阵,接着计算每个口令的强度评估值,最后计算得出分级强度阈值,完成针对真实口令数据的分级口令字典;1.1口令数据训练样本生成;1.2计算概率转移矩阵;采用二阶马尔可夫模型,将口令分解为多个三连字符串,通过统计所有的三连字符组合,计算得到口令数据的概率转移矩阵;口令的二阶马尔可夫模型中的概率转移矩阵T(m,n,k)中的每个元素表示已知前缀为“mn”时下一个字符为“k”的概率,它可以由频率矩阵f(m,n,k)/f(m,n,∞)计算得到;其中m,n,k分别表示口令字符集中的对应字符,f(m,n,k)表示三字符串“mnk”的统计频数,f(m,n,∞)表示所有前缀为“mn”的三字符串的频数;具体步骤如下:1.2.1定义口令字符集U,本方法U包含0‑9,a‑z和一个特殊字符代表符$,共37个字符;初始化三元概率转移矩阵T各元素t(m,n,k)为0,其中m,n,k分别表示口令字符集U中的对应字符;1.2.2依次读入口令数据训练样本集,对每一个口令字符串s:计算口令串长度len=length(s),length(s)表示口令字符串s的字符长度,分解口令为len‑2个三字符子串;对每一个三字符子串stri,1≤i≤len‑2:更新统计该三字符子串和二字符前缀串的频次:f(ci,ci+1,ci+2)=f(ci,ci+1,ci+2)+1,f(ci,ci+1,∞)=f(ci,ci+1,∞)+1,其中ci为口令串s的第i个字符,i从1开始计数,以此类推;U为字符集,f(ci,ci+1,∞)定义为∑x∈Uf(ci,ci+1,x),∑为累加符号;1.2.3计算矩阵T的所有元素t(m,n,k):每个三字符子串出现的频次除以该子串的二字符前缀串的频次,即其中U,m,n,k的描述同上;1.3计算口令评估值并分级;口令的强度评估值设置为该口令串的所有三字符子串在三元概率转移矩阵T中对应元素的概率值最高3个的乘积,采用设定弱口令所占的百分比来设定阈值,训练马尔可夫模型训练时采用抽样数据减少训练计算复杂度,在应用马尔可夫模型时采用的是全体真实口令数据;具体步骤如下:1.3.1初始化单口令子串强度值数组temp各单元为0,初始化口令数据强度值ts为0,设定口令强度分级数n=3;1.3.2依次读入口令数据样本全集,对每一个口令字符串s:i.计算口令串长度len=length(s),length(s)表示口令字符串s的字符长度,分解口令为len‑2个三字符子串;对每一个三字符子串stri(ci,ci+1,ci+2)(1≤i≤len‑2):从口令概率转移矩阵T中取出对应的元素并赋值给temp[i],即temp[i]=t(ci,ci+1,ci+2),表示将cici+1ci+2三字符串对应矩阵T中的值赋值给数组temp中第i个位置;ii.对数组temp从大到小排序;iii.ts=temp[0]*temp[1]*temp[2]并保存到训练样本文本中s对应的“口令强度值”项;清空temp;1.3.3对口令数据训练样本集按新列“口令强度值”从大到小排序,记录总个数为num;1.3.4设定阈值百分比t1,t2(tn‑1),其中0<t1<t2(tn‑1)<1,n为多级布鲁姆过滤器的级数;本方法n=3时,定义强度值百分比属于[0,t1]的为一级弱口令,属于[t1,t2]的为二级口令,属于[t2,1]的为三级强口令;计算分级临界值:S1=num*t1,S2=num*t2,得到排序后的口令数据训练样本集中S1,S2位置对应的口令的强度评估值TS1,TS2;1.3.5对按“口令强度值”排序后的口令数据训练样本集,根据分级临界值分别归类n=3级,ts(s)<TS1则口令s判定为一级弱口令,TS1≤ts(s)<TS2则口令s判定为二级口令,ts(s)≥TS2则口令s判定为三级强口令,然后分级保存口令;2.多级布鲁姆过滤器的训练与口令检验;按照第一阶段马尔可夫模型口令数据训练后,采用布鲁姆过滤器模型保存n级口令,提供高效检索;2.1多级布鲁姆过滤器训练过程;本方法的每一级口令采用标准布鲁姆过滤器构建,需要根据分级口令数据量计算得到各级布鲁姆过滤器的参数;参数包括每级过滤器的误判率f,哈希函数个数K及函数集{H1,H2,…,HK},元素集合Ni,位串向量长度Mi,其中1≤i≤n=3;训练过程通过把同一级的每个口令串s依次导入本级布鲁姆过滤器,计算s在对应各个哈希函数的值,并把过滤器内哈希值对应的向量所在比特位设为“1”来完成;具体步骤如下:2.1.1选定布鲁姆过滤器哈希函数个数K=9,相应表示各级布鲁姆过滤器的哈希函数集为{H1,H2,…,H9},RS、JS、P.J.Weinberger、ELF、BKDR、SDBM、DJB、AP和CRC哈希函数,误判率f=0.005,i的初始值为1,表示某一级布鲁姆过滤器;2.1.2构建第i级布鲁姆过滤器,1≤i≤n=3:i.计算或获取第i级口令数据总数Ni;ii.根据Ni、f、K计算得到第i级布鲁姆过滤器的位串向量长度Mi;初始化第i级布鲁姆过滤器内部位串向量各比特位为“0”;iii.读入第i级口令训练集的每一个口令s并映射到本级布鲁姆过滤器中:a)设置哈希函数计数器j=1;b)计算s的哈希函数值Hj(s),并把本级位串向量的第Hj(s)个比特位置为“1”,更改计数器j=j+1;c)若j与K数值相等结束,否则转到b);2.1.3若i等于n结束,否则转到(2);哈希函数的个数K越多,则每个口令串映射到过滤器位向量里的位数越多,则误判率理论上会降低;但是当训练的口令数据增加后,向量里被置为1的地方逐渐增加又导致误判率升高;根据实验,设定了上述口令分级中可接受的哈希函数个数和误判率;2.2口令分级检验过程;对口令训练集运用马尔可夫模型和多级布鲁姆过滤器做二阶段组合训练;训练后得到的多级布鲁姆过滤器自身保存了不同级口令的强度模式,可以独立于马尔可夫模型,单独完成口令数据的快速批量分级判定;口令的分级检验过程,导入待检测的批量口令串s,计算得到它在哈希函数集中所有哈希函数的函数值,然后依次判定第一级布鲁姆过滤器所有的对应位是否为1;若是,则判定s为一级弱口令,若不是则进入第二级布鲁姆过滤器判定,再不是进三级判定;最终给出该口令是哪一级口令;具体步骤如下:2.2.1读入待测口令s:i.计算s的K个哈希函数值:a)设置哈希函数序号计数器j=1;b)计算s的哈希函数值Hj(s),更改计数器j=j+1;c)若j等于K结束,否则转到b);ii.查询多级布鲁姆过滤器:a)设置布鲁姆过滤器级数序号计数器i=1;b)检验第i级布鲁姆过滤器的位向量的第H1(s),H2(s),…,H9(s)个位是否全为1,若是则判定为第i级口令,结束查询;否则更改计数器i=i+1;c)若i>3,判定为第3级口令,结束查询;否则转到b);2.2.2若还有待测口令,则转到(1),否则结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410460356.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top