[发明专利]一种基于扩展的sLDA模型对图像进行标题注释的方法有效

专利信息
申请号: 201810759844.2 申请日: 2018-07-11
公开(公告)号: CN108984726B 公开(公告)日: 2022-10-04
发明(设计)人: 秦丹阳;冯攀;纪萍;马静雅;张岩;杨松祥 申请(专利权)人: 黑龙江大学
主分类号: G06F16/58 分类号: G06F16/58;G06F16/78;G06V10/762
代理公司: 哈尔滨市松花江专利商标事务所 23109 代理人: 杨立超
地址: 150080 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 扩展 slda 模型 图像 进行 标题 注释 方法
【权利要求书】:

1.一种基于扩展的sLDA模型对图像进行标题注释的方法,其特征在于,包括:

步骤一、对于输入的图像,提取图像的局部特征,并利用K-means算法得到图像的N个视觉词汇wn,其中n∈{1,2...,N},N为正整数;

所述K-means算法的聚类中心获取方式为:

已知初始的k个均值点m1,...,mk,按照下面两个步骤交替进行:

步骤一一、将每个观测点分配到聚类中,使得组内平方和达到最小,即将观测点分配到离它最近的均值点;

步骤一二、对于上一步得到的每一个聚类,以聚类中观测值的图心作为新的均值点;

步骤二、使用LDA模型表示给定文档隐藏变量的后验分布:

其中α和β是模型参数,z和θ分别是主题变量和主题比例;

步骤三、在步骤二中引入响应变量y以及响应变量的参数η和δ,同时将并将响应变量分布定义成多变量伯努利分布,即将公式(3)表示为:

步骤四、根据基于凸性的LDA推理变分算法将式(5)近似成其中狄利克雷参数γ和多项参数(φ12,...,φN)均为自由的变分参数;zn为第n个词的主题变量;将log p(θ,z,w|α,β,η,δ)和q(θ,z|γ,φ)期望的差值记作L;

步骤五、求取能够使L的下界达到最大值的变分参数γ和φ;

步骤五具体为:

步骤五一、利用φni最大化L的下界,φni表示第n个视觉词汇由隐藏主题i生成的概率,因此并通过分离包含φni的项并添加适当的拉格朗日乘子来形成拉格朗日函数:

ψ(x)是双伽马函数;

计算关于φni的导数:

其中βiv表示对于合适的v的v为词典的第v个词;

进一步得到在响应变量服从伯努利分布条件下,参数φn的更新公式

步骤五二 利用γi最大化L的下界,γi表示后验狄利克雷参数的第i个组成部分;包含γi的项:

对γi求导:

令导数为零:

迭代方程(16)至(19)直到边界收敛,进而得到能够使L的下界达到最大值的变分参数γ和φ;

步骤六、估计模型参数ψ={α,β,η,δ};

步骤六具体为:

步骤六一、求得参数β的公式为:

步骤六二、求得参数α的过程为:对于公式(22),

进行求导得

对公式(23)通过牛顿迭代法求取α的值;其中M表示训练集的文档数目;角标d表示第d篇文档;

步骤六三、求得参数η和σ2的过程为:

其中μ(·)=EGLM[Y|·];

对σ2求导,在上评估

经过计算,最终得到参数估计结果:

将参数αi、βij、ηi和δi进行组合即可得到模型参数ψ={α,β,η,δ};

步骤七、根据模型参数ψ和变分参数γ和φ预测响应变量y的分布p(y|w);

步骤七具体为:

将没有标题的新文档w作为输入,利用φn和q(θ)来近似求解条件概率p(y|w),如下:

其中p(y|w)用于推断新文档w最可能的标题词。

2.根据权利要求1所述基于扩展的sLDA模型对图像进行标题注释的方法,其特征在于:步骤三具体为:

利用η和δ生成响应变量y,其中设响应变量y的分布符合广义线性模型:

其中于是公式(3)能够表示为

其中

3.根据权利要求2所述基于扩展的sLDA模型对图像进行标题注释的方法,其特征在于:步骤四具体为:

通过以下公式将公式(5)近似为

令L(γ,φ;α,β)表示式(8)的右边,式(8)表示为

log p(w|α,β)=L(γ,φ;α,β)+D(q(θ,z|γ,φ)||p(θ,z|w,α,β)) (9)

通过使用p和q的因式分解将L写作式(10):

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黑龙江大学,未经黑龙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810759844.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top