[发明专利]一种基于扩展的sLDA模型对图像进行标题注释的方法有效
申请号: | 201810759844.2 | 申请日: | 2018-07-11 |
公开(公告)号: | CN108984726B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 秦丹阳;冯攀;纪萍;马静雅;张岩;杨松祥 | 申请(专利权)人: | 黑龙江大学 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06F16/78;G06V10/762 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 杨立超 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于扩展的sLDA模型对图像进行标题注释的方法,是为了解决现有的图像注释方法会遇到可伸缩性问题,只能处理一个小的注释词汇表,缺乏通用型和易用性的缺点而提出的,包括:对于输入的图像,提取图像的局部特征,并利用K‑means算法得到图像的N个视觉词汇;使用LDA模型表示给定文档隐藏变量的后验分布;引入响应变量并将响应变量分布定义成多变量伯努利分布;使用基于凸性的LDA推理变分算法进行公式近似;求取变分参数值;估计模型参数;预测响应变量的分布。本发明适用于图像标题注释系统。 | ||
搜索关键词: | 一种 基于 扩展 slda 模型 图像 进行 标题 注释 方法 | ||
【主权项】:
1.一种基于扩展的sLDA模型对图像进行标题注释的方法,其特征在于,包括:步骤一、对于输入的图像,提取图像的局部特征,并利用K‑means算法得到图像的N个视觉词汇wn,其中n∈{1,2...,N},N为正整数;步骤二、使用LDA模型表示给定文档隐藏变量的后验分布:
其中α和β是模型参数,z和θ分别是主题变量和主题比例;步骤三、在步骤二中引入响应变量y以及响应变量的参数η和δ,同时将并将响应变量分布定义成多变量伯努利分布,即将公式(3)表示为:
步骤四、根据基于凸性的LDA推理变分算法将式(5)近似成
其中狄利克雷参数γ和多项参数(φ1,φ2,...,φN)均为自由的变分参数;zn为第n个词的主题变量;将logp(θ,z,w|α,β,η,δ)和q(θ,z|γ,φ)期望的差值记作L;步骤五、求取能够使L的下界达到最大值的变分参数γ和φ;步骤六、估计模型参数ψ={α,β,η,δ};步骤七、根据模型参数ψ和变分参数γ和φ预测响应变量y的分布p(y|w)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黑龙江大学,未经黑龙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810759844.2/,转载请声明来源钻瓜专利网。