[发明专利]图像标注方法及其装置有效
申请号: | 201110197235.0 | 申请日: | 2011-07-14 |
公开(公告)号: | CN102880612A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 曹琼;刘汝杰;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;陶海萍 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 标注 方法 及其 装置 | ||
技术领域
本发明涉及图像分类和检索领域,特别涉及一种图像标注方法及其装置。
背景技术
随着计算机网络和多媒体技术的发展,互联网上可获取的多媒体信息的数量也得到非常快速的增长。多媒体信息的激增给用户提供丰富资源的同时,如何从海量的信息中快速有效地获得感兴趣的资源也给研究人员带来巨大的挑战。由此,图像分类和检索技术日益得到重视。
基于内容的图像检索(CBIR,Content-Based Image Retrieval)技术自上世纪九十年代提出以来得到了广泛的研究。通过将图像自身的视觉内容特征(例如颜色、纹理、形状和空间层次等底层特征)作为其索引,可以检索视觉特征上相似的其他图像。从而可以根据图像低级特征计算的视觉相似度来直接比较和检索图像。
但是,由于使用了图像的底层视觉特征来描述图像,而这些特征与人们对图像高层语义的主观判断没有统一规则的相关性。当完全不同类型的图像有可能具有类似的底层特征时,根据视觉相似度直接比较的方法往往不能得到准确的检索结果。
另一方面,出现了一些通过基于文本的图像检索(TBIR,Text-Based Image Retrieval)技术对图像进行标注的方法。通过低级特征寻找待标注图像的相似图像,将相似图像的标签分配给待标注图像,从而可以将图像视觉和相关文本信息结合进行检索。
但是在实现本发明的过程中,发明人发现现有技术的缺陷在于:目前由于图像的低级特征和高级语义之间存在距离,图像标注的准确度低;而如果仅利用人机交互或者手工方式对图像进行标注,则效率低且用户负担重。
发明内容
本发明实施例提供一种图像标注方法及其装置,目的在于同时考虑图像的低级特征和高级语义,提高图像标注的准确度;并且实现标签自动标注,提高标注的效率。
根据本发明实施例的一个方面,提供一种图像标注方法,所述图像标注方法包括:
为输入图像获取初始的包括多个标签的标签集,其中根据所述多个标签确定表示所述输入图像的语义的准确度;
计算所述输入图像的标签集与存储在数据库中的比较图像的标签集之间的基于标签集的相似度;
将所述基于标签集的相似度和基于视觉的相似度进行合并计算,以获得所述输入图像和所述比较图像的合并相似度;
基于所述合并相似度更新所述输入图像的标签集。
根据本发明实施例的另一个方面,提供一种图像标注装置,所述图像标注装置包括:
初始化器,为输入图像获取初始的包括多个标签的标签集,其中根据所述多个标签确定表示所述输入图像的语义的准确度;
关系计算器,计算所述输入图像的标签集与存储在数据库中的比较图像的标签集之间的基于标签集的相似度;
合并计算器,将所述基于标签集的相似度和基于视觉的相似度进行合并计算,以获得所述输入图像和所述比较图像的合并相似度;
标签集更新器,基于所述合并相似度更新所述输入图像的标签集。
本发明实施例的有益效果在于,通过将基于标签集的相似度和基于视觉的相似度合并,可以同时考虑图像的低级特征和高级语义,提高图像标注的准确度;并且实现标签自动标注,提高标注的效率。
可以通过相同的方法或类似的方法将针对一种实施方式介绍和/或例示的特征用于一个或更多个其它实施方式,与其它实施方式的特征相组合或者取代其它实施方式的特征。
应强调的是,本说明书中使用的术语“包括”和“包含”用于指出所述的特征、要件、步骤或组件的存在,但并不排除一个或更多个其它特征、要件、步骤、组件或它们的组合的存在或添加。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
图1是本发明实施例的图像标注方法的一流程图;
图2是本发明实施例中进行标注后的图像的示意图;
图3是本发明实施例的获得初始的标签集的一示意图;
图4是本发明实施例的图像标注方法的又一流程图;
图5是本发明实施例的图像标注方法的迭代过程的一示意图;
图6是本发明实施例中图像标注装置的一构成示意图;
图7是本发明实施例中图像标注装置的又一构成示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例作进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110197235.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序