[发明专利]一种变分自编码混合模型在审
申请号: | 201711433048.1 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108171324A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 陈亚瑞;蒋硕然;赵青;杨巨成;张传雷;赵希;刘建征 | 申请(专利权)人: | 天津科技大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王利文 |
地址: | 300222 天津市河*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种变分自编码混合模型,其主要技术特点是:由K个变分自编码模型组成,其中每个变分自编码模型由K维的二值随机隐变量指示,每个变分自编码模型的概率解码模型及概率编码模型均由单隐层神经网络组成,指示隐变量的后验概率分布由基于截棍的神经网络组成。本发明设计合理,其采用自编码混合模型估计隐变量和样本之间的关系,能够提高模型生成样本的能力,基于隐变量学习混合生成模型的权重,能够保证对隐变量抽样的简便,并且在抽样生成样本时可以由隐变量自主确定最佳的生成模型,同时,本发明有效地扩展了隐变量空间即概率编码空间,提高了模型表示的精度。 1 | ||
搜索关键词: | 自编码 混合模型 样本 概率编码 神经网络 生成模型 变量抽样 变量空间 变量指示 后验概率 技术特点 解码模型 模型表示 模型生成 单隐层 有效地 权重 抽样 概率 保证 学习 | ||
令{θ1,θ2,...,θK}表示各分布分量的参数,π=[π1,π2,...,πK]表示各分布分量的权重,且K维的二值指示隐变量c=[c1,c2,…,cK]T,满足ck∈{0,1}且
则πk=p(ck=1)是第k个模型的权重,变分自编码混合模型中指示隐变量概率分布p(c|π)及生成数据的条件概率分布p(x|z,c)分别为:
变分自编码混合模型的联合概率分布形式为:
p(x,z,c)=p(x|z,c)p(z)p(c|π)。
3.根据权利要求1所述的一种变分自编码混合模型,其特征在于:所述单隐层神经网络的条件分布pθ(x|z)为:y=fσ(W2tanh(W1z+b1)+b2)
其中,W1,b1表示概率解码中单隐层神经网络输入层的权重和偏置,W2,b2表示单隐层神经网络输出层的权重和偏置,故参数θ={W1,W2,b1,b2}。
对于连续隐变量z,基于单隐层神经网络的条件分布qφ(z|x)为:
log qφ(z|x)=log N(z;μ,δ2I)
μ=W4h+b4
logδ2=W5h+b5
h=tanh(W3z+b3)
其中,W3,b3表示概率编码中单隐层神经网络输入层的权重和偏置,W4,b4,W5,b5表示单隐层神经网络输出层的权重和偏置,故参数φ={W3,W4,W5,b3,b4,b5}。
4.根据权利要求1所述的一种变分自编码混合模型,其特征在于:所述指示隐变量的后验概率分布表示如下:对于隐变量π,采用单层神经网络学习后验qη(π|z):
α=tanh(W7(W6z+b6)+b7)
其中,W6,b6表示单隐层神经网络输入层的权重和偏置,W7,b7表示单隐层神经网络输出层的权重和偏置,故参数η={W7,W8,b7,b8}。
5.根据权利要求1所述的一种变分自编码混合模型,其特征在于:所述变分自编码混合模型包括概率解码模型的模型参数、概率编码模型的模型参数及指示隐变量后验概率分布的模型参数,上述参数采用梯度下降方法优化目标函数计算得到。该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津科技大学,未经天津科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711433048.1/,转载请声明来源钻瓜专利网。