[发明专利]一种基于扩展的sLDA模型对图像进行标题注释的方法有效

申请号：	201810759844.2	申请日：	2018-07-11
公开（公告）号：	CN108984726B	公开（公告）日：	2022-10-04
发明（设计）人：	秦丹阳;冯攀;纪萍;马静雅;张岩;杨松祥	申请（专利权）人：	黑龙江大学
主分类号：	G06F16/58	分类号：	G06F16/58;G06F16/78;G06V10/762
代理公司：	哈尔滨市松花江专利商标事务所 23109	代理人：	杨立超
地址：	150080 黑龙***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于扩展 slda 模型图像进行标题注释方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于扩展的sLDA模型对图像进行标题注释的方法，其特征在于，包括：

步骤一、对于输入的图像，提取图像的局部特征，并利用K-means算法得到图像的N个视觉词汇w_n，其中n∈{1,2...,N}，N为正整数；

所述K-means算法的聚类中心获取方式为：

已知初始的k个均值点m₁,...,m_k，按照下面两个步骤交替进行：

步骤一一、将每个观测点分配到聚类中，使得组内平方和达到最小，即将观测点分配到离它最近的均值点；

步骤一二、对于上一步得到的每一个聚类，以聚类中观测值的图心作为新的均值点；

步骤二、使用LDA模型表示给定文档隐藏变量的后验分布：

其中α和β是模型参数，z和θ分别是主题变量和主题比例；

步骤三、在步骤二中引入响应变量y以及响应变量的参数η和δ，同时将并将响应变量分布定义成多变量伯努利分布，即将公式(3)表示为：

步骤四、根据基于凸性的LDA推理变分算法将式(5)近似成其中狄利克雷参数γ和多项参数(φ₁,φ₂,...,φ_N)均为自由的变分参数；z_n为第n个词的主题变量；将log p(θ,z,w|α,β,η,δ)和q(θ,z|γ,φ)期望的差值记作L；

步骤五、求取能够使L的下界达到最大值的变分参数γ和φ；

步骤五具体为：

步骤五一、利用φ_ni最大化L的下界，φ_ni表示第n个视觉词汇由隐藏主题i生成的概率，因此并通过分离包含φ_ni的项并添加适当的拉格朗日乘子来形成拉格朗日函数：

ψ(x)是双伽马函数；

计算关于φ_ni的导数：

其中β_iv表示对于合适的v的v为词典的第v个词；

进一步得到在响应变量服从伯努利分布条件下，参数φ_n的更新公式

步骤五二利用γ_i最大化L的下界，γ_i表示后验狄利克雷参数的第i个组成部分；包含γ_i的项：

对γ_i求导：

令导数为零：

迭代方程(16)至(19)直到边界收敛，进而得到能够使L的下界达到最大值的变分参数γ和φ；

步骤六、估计模型参数ψ＝{α,β,η,δ}；

步骤六具体为：

步骤六一、求得参数β的公式为：

步骤六二、求得参数α的过程为：对于公式(22)，

进行求导得

对公式(23)通过牛顿迭代法求取α的值；其中M表示训练集的文档数目；角标d表示第d篇文档；

步骤六三、求得参数η和σ²的过程为：

其中μ(·)＝E_GLM[Y|·]；

对σ²求导，在上评估

经过计算，最终得到参数估计结果：

将参数α_i、β_ij、η_i和δ_i进行组合即可得到模型参数ψ＝{α,β,η,δ}；

步骤七、根据模型参数ψ和变分参数γ和φ预测响应变量y的分布p(y|w)；

步骤七具体为：

将没有标题的新文档w作为输入，利用φ_n和q(θ)来近似求解条件概率p(y|w)，如下：

其中p(y|w)用于推断新文档w最可能的标题词。

2.根据权利要求1所述基于扩展的sLDA模型对图像进行标题注释的方法，其特征在于：步骤三具体为：

利用η和δ生成响应变量y，其中设响应变量y的分布符合广义线性模型：

其中于是公式(3)能够表示为

其中

3.根据权利要求2所述基于扩展的sLDA模型对图像进行标题注释的方法，其特征在于：步骤四具体为：

通过以下公式将公式(5)近似为

令L(γ,φ；α,β)表示式(8)的右边，式(8)表示为

log p(w|α,β)＝L(γ,φ；α,β)+D(q(θ,z|γ,φ)||p(θ,z|w,α,β)) (9)

通过使用p和q的因式分解将L写作式(10)：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于黑龙江大学，未经黑龙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810759844.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种跨网闸数据同步方法
下一篇：一种数据库自动备份方法、装置、设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于扩展的sLDA模型对图像进行标题注释的方法有效

专利文献下载