[发明专利]应用于随机点模式有限混合模型吉布斯参数采样方法在审
申请号: | 202010105441.3 | 申请日: | 2020-02-20 |
公开(公告)号: | CN111369002A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 刘伟峰;王志;黄梓龙;丁禹心 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06N7/00 | 分类号: | G06N7/00;G06F17/18 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 随机 模式 有限 混合 模型 吉布斯 参数 采样 方法 | ||
1.应用于随机点模式有限混合模型吉布斯参数采样方法,其特征在于,该方法具体是:
步骤(1).构建随机点模式有限混合模型;
具有K个随机源的点模式混合模型表示为:
f(Xn|Θ)=π1f(Xn|θ1)+π2f(Xn|θ2)+…+πKf(Xn|θK);Xn表示第n个随机点模式观测数据,n=1,2,…,N,N为随机点模式观测数据数量,表示R的有限集空间,R为实数空间;
点模式混合模型的参数集Θ={π1,π2,…,πK,θ1,θ2,…,θK}∈(R+×Θ)K,R+表示正实数空间;{θ1,θ2,…,θK}为随机点模式分布函数中的参数变量,{π1,π2,…,πK}为混合权重,πk是第k分布元的混合权重,并且满足πk≥0,
步骤(2).构建随机点模式似然函数;
对于独立的第n个随机点模式观测数据似然函数表示为:是相互独立的Xn的似然函数,f(xn|θk)表示Xn中的单点数据xn的分布函数;缺失变量en={en,1,en,2,…,en,K},en,k为缺失变量中的第k维缺失变量,k=1,2,…,K,用来指示点模式中单点数据xn的点模式类别;en与Xn组成完全数据(Xn,en),X1:N表示N个随机点模式观测数据的集合,e1:N表示N个缺失变量的集合;
点模式混合模型的参数后验分布表示为:p(Θ)为参数的先验分布,p(Θ|X)为参数的后验分布,正则常量表示随机点模式的似然函数;
对于得到的第n个随机点模式观测数据的第i个数据xn,i,xn,i∈Xn,定义一个K维的指示变量,每一维指示了混合分布中的一个分布元,K维的缺失变量只有一维为1,其他各维为0,表示为en=[en,1,…,en,K]T,并且满足en,k∈{0,1},其中en,k=1表示数据xn由分布元f(xn|θk)产生;以高斯混合分布作为点模式的特征分布,相应点模式参数集为θk={ρk,μk,Σk},其中ρk是基数,μk是均值,Σk是协方差阵;
步骤(3).构建随机点模式有限混合模型参数先验分布;
在高斯混合情况下,先验参数为根据贝叶斯公式将先验分布p(Θ)分解:p(Θ)=p(π1:K)p(ρ1:K|π1:K)p(Σ1:K|ρ1:K,π1:K,μ1:K)p(μ1:K|ρ1:K,π1:K,Σ1:K);采用狄利克雷分布作为分类分布的共轭先验;
如果各分布元比例未知,采用等值狄利克雷分布:
基数lk表示第k个随即点模式的基数,基数的先验分布服从泊松分布;
协方差的逆矩阵的先验服从威希特分布W(V,β)表示关于参数V和β的威希特分布,V是一个正定矩阵,β是自由度;
均值采用高斯分布作为RPP-FMM均值的共轭先验,是每个随机点模式的已知均值;
步骤(4).根据模型参数先验分布,得到模型参数的后验分布;
后验混合权重服从狄利克雷分布,后验均值服从高斯分布,后验方差服从威希特分布;
参数的后验分布混合权重{π1,π2,…,πK}满足狄利克雷分布:
p(π1,π2…,πK)=Dir(α1+l1,α2+l2,…,αK+lK);常数αk>0,lk是属于第k个随机分布元观测数据的个数,k=1,2,…,K;
缺失变量{en,1,…,en,K}根据Bayes公式来估计缺失数据:
f(xn|θk)表示随机点模式观测数据Xn中的单点数据xn的分布函数,ρk表示第k个随机点模式观测数据的基数,表示第k个随机点模式观测数据每个维度上的指示变量值的和;
基数分布:
协方差Σk,协方差的逆矩阵服从威希特分布:其中α0和β0是正常数,两个调节参数M0>0,N0>0;
均值μk满足参数为{ξk,∑k}的高斯分布,从下式中采样:
p(μk)=N(μk;ξk,Σk),ξk为高斯分布的均值,Σk为高斯分布的协方差;
步骤(5).采用吉布斯采样算法和贝叶斯信息准则相结合的采样算法,估计混合分布中分布元个数以及模型参数值;
贝叶斯信息准则定义为:BIC(mk,Θk,Xk)=-2logL(Θk,mk|Xk)+Mklnnk;其中,Mk是独立参数的个数,logL(Θk,mk|Xk)表示参数集Θk和元素个数mk的对数似然函数;
Mk=3mk+2,
在可供选择的模型类中,使贝叶斯信息达到最小的那个模型即为可取模型,可取模型的参数估计推导为:
参数mk,Θk从BIC(mk,Θk)的最小似然函数中获得,得到参数集Θk以及分布元个数mk;
利用参数集Θk和分布元个数mk,根据吉布斯采样算法估计出模型参数值。
2.如权利要求1所述的应用于随机点模式有限混合模型吉布斯参数采样方法,其特征在于,步骤(5)中吉布斯采样算法估计出模型参数值的具体方法是:
a.初始化从条件密度p(θi|θ-i)中采样;
b.从中采样,得到依次类推,从中采样得到
c.实现从到的跳变;
d.重复a-c,得到一条马尔可夫链;
马尔可夫链中的稳定点即是分布中的极值点,作为最终的模型参数估计值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010105441.3/1.html,转载请声明来源钻瓜专利网。