[发明专利]基于多模态的图像标注装置以及方法有效
申请号: | 201310251807.8 | 申请日: | 2013-06-24 |
公开(公告)号: | CN104239359B | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 刘曦;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司11127 | 代理人: | 陶海萍,田勇 |
地址: | 日本神奈*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 图像 标注 装置 以及 方法 | ||
1.一种基于多模态的图像标注装置,所述图像标注装置包括:
分数生成单元,利用训练图像以及图像的多个模态,为查询图像生成多组关于标注词典中所有标签的第一分数;
后融合单元,将获得的多组分数进行融合来获得关于所有标签的最终分数;
标签选择单元,根据所有标签的最终分数,选择具有较大标签分数的一个或多个标签作为所述查询图像的标签,
其中,所述图像标注装置还包括:
模态拼接单元,将图像的所有模态直接拼接成一组合模态;
并且,所述分数生成单元还用于利用所述训练图像及所述组合模态,为所述查询图像生成一组关于所述所有标签的第二分数;以及所述后融合单元将多组所述第一分数与所述第二分数进行融合来获得关于所述所有标签的最终分数。
2.根据权利要求1所述的图像标注装置,其中,所述后融合单元具体用于:对多组所述第一分数进行线性组合;并且将利用所述组合模态生成的所述第二分数作为约束项以引导所述线性组合。
3.根据权利要求2所述的图像标注装置,其中,所述后融合单元中的所述线性组合获得的标签分数为:TSc=∑t=1,...,MwtTSt;其中TSt为所述第一分数,M为所述多个模态的个数;wt为线性权重,所述线性权重满足如下条件:
(1)所有线性权重均大于或者等于零;
(2)线性权重的L2-范数最小;
(3)线性组合中的TSc和TSa尽可能接近;所述TSa为所述第二分数。
4.根据权利要求3所述的图像标注装置,其中,所述线性组合满足如下约束:
s.t.wi≥0,i=1,...,M
其中,w=(w1,w2,…,wM)T,μ是一个给定的常数。
5.根据权利要求3所述的图像标注装置,其中,所述图像标注装置还包括:
分数更新单元,根据所述线性组合获得的标签分数TSc来更新所述第二分数TSa;
并且,所述后融合单元还用于根据更新后的所述第二分数TSa求解所述线性权重w,以更新所述线性组合获得的标签分数TSc。
6.根据权利要求5所述的图像标注装置,其中,所述图像标注装置还包括:
条件判断单元,判断是否满足预设条件;
在满足预设条件时,所述后融合单元还用于将获得的标签分数TSc作为关于所有标签的最终分数;在不满足预定条件时,所述分数更新单元继续更新所述第二分数TSa。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310251807.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序