[发明专利]应用于随机点模式有限混合模型吉布斯参数采样方法在审

专利信息
申请号: 202010105441.3 申请日: 2020-02-20
公开(公告)号: CN111369002A 公开(公告)日: 2020-07-03
发明(设计)人: 刘伟峰;王志;黄梓龙;丁禹心 申请(专利权)人: 杭州电子科技大学
主分类号: G06N7/00 分类号: G06N7/00;G06F17/18
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 杨舟涛
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 应用于 随机 模式 有限 混合 模型 吉布斯 参数 采样 方法
【权利要求书】:

1.应用于随机点模式有限混合模型吉布斯参数采样方法,其特征在于,该方法具体是:

步骤(1).构建随机点模式有限混合模型;

具有K个随机源的点模式混合模型表示为:

f(Xn|Θ)=π1f(Xn1)+π2f(Xn2)+…+πKf(XnK);Xn表示第n个随机点模式观测数据,n=1,2,…,N,N为随机点模式观测数据数量,表示R的有限集空间,R为实数空间;

点模式混合模型的参数集Θ={π12,…,πK12,…,θK}∈(R+×Θ)K,R+表示正实数空间;{θ12,…,θK}为随机点模式分布函数中的参数变量,{π12,…,πK}为混合权重,πk是第k分布元的混合权重,并且满足πk≥0,

步骤(2).构建随机点模式似然函数;

对于独立的第n个随机点模式观测数据似然函数表示为:是相互独立的Xn的似然函数,f(xnk)表示Xn中的单点数据xn的分布函数;缺失变量en={en,1,en,2,…,en,K},en,k为缺失变量中的第k维缺失变量,k=1,2,…,K,用来指示点模式中单点数据xn的点模式类别;en与Xn组成完全数据(Xn,en),X1:N表示N个随机点模式观测数据的集合,e1:N表示N个缺失变量的集合;

点模式混合模型的参数后验分布表示为:p(Θ)为参数的先验分布,p(Θ|X)为参数的后验分布,正则常量表示随机点模式的似然函数;

对于得到的第n个随机点模式观测数据的第i个数据xn,i,xn,i∈Xn,定义一个K维的指示变量,每一维指示了混合分布中的一个分布元,K维的缺失变量只有一维为1,其他各维为0,表示为en=[en,1,…,en,K]T,并且满足en,k∈{0,1},其中en,k=1表示数据xn由分布元f(xnk)产生;以高斯混合分布作为点模式的特征分布,相应点模式参数集为θk={ρkkk},其中ρk是基数,μk是均值,Σk是协方差阵;

步骤(3).构建随机点模式有限混合模型参数先验分布;

在高斯混合情况下,先验参数为根据贝叶斯公式将先验分布p(Θ)分解:p(Θ)=p(π1:K)p(ρ1:K1:K)p(Σ1:K1:K1:K1:K)p(μ1:K1:K1:K1:K);采用狄利克雷分布作为分类分布的共轭先验;

如果各分布元比例未知,采用等值狄利克雷分布:

基数lk表示第k个随即点模式的基数,基数的先验分布服从泊松分布;

协方差的逆矩阵的先验服从威希特分布W(V,β)表示关于参数V和β的威希特分布,V是一个正定矩阵,β是自由度;

均值采用高斯分布作为RPP-FMM均值的共轭先验,是每个随机点模式的已知均值;

步骤(4).根据模型参数先验分布,得到模型参数的后验分布;

后验混合权重服从狄利克雷分布,后验均值服从高斯分布,后验方差服从威希特分布;

参数的后验分布混合权重{π12,…,πK}满足狄利克雷分布:

p(π12…,πK)=Dir(α1+l12+l2,…,αK+lK);常数αk>0,lk是属于第k个随机分布元观测数据的个数,k=1,2,…,K;

缺失变量{en,1,…,en,K}根据Bayes公式来估计缺失数据:

f(xnk)表示随机点模式观测数据Xn中的单点数据xn的分布函数,ρk表示第k个随机点模式观测数据的基数,表示第k个随机点模式观测数据每个维度上的指示变量值的和;

基数分布:

协方差Σk,协方差的逆矩阵服从威希特分布:其中α0和β0是正常数,两个调节参数M0>0,N0>0;

均值μk满足参数为{ξk,∑k}的高斯分布,从下式中采样:

p(μk)=N(μk;ξkk),ξk为高斯分布的均值,Σk为高斯分布的协方差;

步骤(5).采用吉布斯采样算法和贝叶斯信息准则相结合的采样算法,估计混合分布中分布元个数以及模型参数值;

贝叶斯信息准则定义为:BIC(mkk,Xk)=-2logL(Θk,mk|Xk)+Mklnnk;其中,Mk是独立参数的个数,logL(Θk,mk|Xk)表示参数集Θk和元素个数mk的对数似然函数;

Mk=3mk+2,

在可供选择的模型类中,使贝叶斯信息达到最小的那个模型即为可取模型,可取模型的参数估计推导为:

参数mkk从BIC(mkk)的最小似然函数中获得,得到参数集Θk以及分布元个数mk

利用参数集Θk和分布元个数mk,根据吉布斯采样算法估计出模型参数值。

2.如权利要求1所述的应用于随机点模式有限混合模型吉布斯参数采样方法,其特征在于,步骤(5)中吉布斯采样算法估计出模型参数值的具体方法是:

a.初始化从条件密度p(θi-i)中采样;

b.从中采样,得到依次类推,从中采样得到

c.实现从到的跳变;

d.重复a-c,得到一条马尔可夫链;

马尔可夫链中的稳定点即是分布中的极值点,作为最终的模型参数估计值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010105441.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top