[发明专利]一种基于HDP-HMM的行为序列的检测方法有效
申请号: | 201810218284.X | 申请日: | 2018-03-16 |
公开(公告)号: | CN108462708B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 陈岱 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08;G06K9/62 |
代理公司: | 西安中科汇知识产权代理有限公司 61254 | 代理人: | 韩冰 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hdp hmm 行为 序列 检测 方法 | ||
本发明公开了一种基于HDP‑HMM的行为序列的建模和检测方法,使用状态轨迹的对数转移概率作为判决指标,更加简单,并建立两个模型从正反两个角度共同决定检测结果,解决了以往检测方法中判决指标参数选取和计算过于复杂的问题。与现有技术相比,本发明在弥补HMM在模型定义和参数估计上的缺陷的同时也取得了更好的检测效果,通过实验可知本发明中的建模和检测方法的平均检测率为95.3%。
技术领域
本发明涉及行为模式分析领域,特别是一种基于HDP-HMM的行为序列的建模和检测方法。
背景技术
HMM在很多领域中得到广泛应用,并有很好的性能,但它本身还是有一些不足。HMM无论是在模型结构的定义还是在模型参数的标准估计方法都受到很大的限制,对于很多现实问题的解决存在很多不完善的地方。比如,最大似然估计方法并没有充分考虑到模型的复杂度,这就很有可能造成参数的过拟合。另外,传统HMM的模型结构必须被事先确定,即模型的观测值和隐藏状态需要预先确定,这使得模型缺乏适应性。
针对HMM存在的这些不足,Beal等人在文献中把分层狄利克雷过程(HierarchicalDirichlet Process,HDP)理论应用到隐马尔可夫模型,并由此提出了一种基于HMM扩展的非参数贝叶斯模型,即分层狄利克雷过程-隐马尔可夫模型(HDP-HMM),也称无限隐马尔可夫模型(infinite Hidden Markov Model,iHMM)。与传统HMM相比, HDP-HMM是一种数据驱动学习算法,它具有无需预知数据的结构,可自动迭代出状态数等优势,因而更能反映出数据的真实特征。HDP-HMM 是一类非参数贝叶斯模型,可以估计时序数据中的状态数,所以它在视觉场景识别、异常检测等诸多领域有非常好的应用前景。
发明内容
本发明的目的是要解决现有技术中存在的不足,提供一种基于 HDP-HMM的行为序列的建模和检测方法。
为达到上述目的,本发明是按照以下技术方案实施的:
一种基于HDP-HMM的行为序列的建模方法,使用HDP-HMM 模型对行为序列进行建模并使用Beam Sampling算法自动迭代出模型参数,具体步骤如下:
S1、建立HDP-HMM模型,选取用户向服务器的HTTP请求的对象序列数据作为观测量来描述用户的行为;
S2、对数据进行预处理,并且将步骤S1中的对象序列数据分为训练数据和测试数据;
S3、将训练数据中所有HTTP请求序列的集合表示为y={y1,...yT};
S4、对模型参数赋予一个初步估计的先验值Sp,然后采用Beam Sampling方法对HDP-HMM模型的参数进行训练:算法引入辅助变量u,通过判断划分出有限数目的隐藏状态,然后使用动态规划迭代计算出状态转移的条件概率,并采样出所有隐藏状态轨迹,假设其他变量已知,迭代地采样出辅助变量u,隐藏状态s,转移矩阵π,共享参数β和其他参数。
具体地,所述S4具体步骤如下:
S41、对辅助变量u采样:
S42、对隐藏状态轨迹s采样:因为在给出辅助变量u时,对于所有的t状态轨迹s仅在满足时的概率非零,而且因为截棍构造的性质,状态轨迹为有限数,因此利用动态规划来对状态进行采样,应用如下等式,利用动态规划来对状态轨迹s进行抽样:
S43、对参数π,φ,β采样:首先定义nij为在状态轨迹s中,状态i一步转移为状态j的次数,i,j∈{1,...,K},K为状态轨迹s中的已知状态数。
另外,本发明还提供一种基于HDP-HMM的行为序列的检测方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810218284.X/2.html,转载请声明来源钻瓜专利网。