[发明专利]一种基于多视图多标签的图片标注方法在审
申请号: | 201510169472.4 | 申请日: | 2015-04-10 |
公开(公告)号: | CN104794183A | 公开(公告)日: | 2015-07-22 |
发明(设计)人: | 陈纯;何占盈;卜佳俊;高珊 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视图 标签 图片 标注 方法 | ||
技术领域
本发明涉及图片标注方法的技术领域,基于多视图多标签的图片标注方法。
背景技术
近年来,随着数码相机在人们日常生活中的爆炸式普及,人们总是淹没于大量可获取的图片中。但是,这些图片往往大部分都不包含标注信息。为了有效地管理,获取和检索这些多媒体数据,一个广泛被采用的方法是将文本标签和图片的内容对应联系起来。有了这些文本标签,图片的检索问题就可以转化成文本检索问题,从而大大提高了计算的有效性和检索的准确度。由于人工标注总是既费时又费力,所以半监督的多标签传播自然而然成为了应用于图片标注的有效方法。首先用户需要标注一小部分图片,然后剩余的未标注图片可以和这些标注图片相互协同,从而自动学习和推断出对应的文本标注信息。
总的来说,自动图片标注任务的关键一步是提取出图片的视觉特征作为图片的机器表达。然而,我们可以却可以从图片中提取出不同源的特征,即多视图特征。不同的的特征描述了图片不同的视觉特性,能够不同程度地帮助用户理解图片内容。已有的研究已经提出了各种针对多视图问题的图片标注方法,但是他们都忽略了视图与视图之间的关联性。虽然有一些基于稀疏表达的方法致力于研究不同源图片特征的选择问题,但是他们只是把不同种类的图片特征直接合并成一统一视图而已。
自动图片标注任务的第二个关键步骤是将每一个未标注图片跟一些给定的文本标签联系起来。但是已有的多标签标注工作基本上受限于(或者部分受限于)面对多标签的传播却仍然独立考虑每一个标签。
据我们所知,至今还没有一种有效的图片标注方法可以同时解决图片特征的多视图问题和多标签之间的联系问题。
发明内容
本发明要克服现有技术的上述缺点,提供一种基于多视图多标签的图片标注方法,以同时解决多视图特征问题和多标签传播问题。
一种基于多视图多标签的图片标注方法,包括如下步骤:
1)从互联网上获取图片和文本标签,建立图片数据库和文本标签数据库;
2)提取图片特征,建立图片视图,每个图片视图包含一种图片特征;
3)建立文本标签关系树,挖掘文本标签之间的关联关系;
4)针对每个图片视图,为图片标注文本标签;
5)为有关联关系的文本标签在不同图片视图中建立相似的标注结果;
6)为数据库中的每张图片标注与其有关联的多个文本标签。
步骤2)中所述的图片特征,包括:
1)提取图片的颜色直方图,得到256维的全局特征,并形成一个视图;
2)提取图片的SIFT特征点,并聚类得到500维的局部特征,并形成一个视图。
步骤3)中所述的文本标签关系树,包括:根据已知的文本标签分类,将属于同类的文本标签标记为类标签下的子标签,遍历所有类,建立文本标签关系树。
步骤5)中所述的有关联关系的文本标签,即在文本标签关系树中属于同一个父类的标签。
本发明提出了一种全新的基于多视图的多标签传播方法,能够同时解决多视图特征问题和多标签传播问题。算法的核心思想包括以下两个方面:(1)相同图片的不同图片特征视图上的标签传播应该不能相差太多;(2)有关联的标签应该具有相似的传播。
本发明的优点是:能够同时解决多视图特征问题和多标签传播问题。
附图说明
图1是本发明的方法流程图。
具体实施方式
一种基于多视图多标签的图片标注方法,包括如下步骤:
1)从互联网上获取图片和文本标签,建立图片数据库和文本标签数据库;
2)提取图片特征,建立图片视图,每个图片视图包含一种图片特征;
3)建立文本标签关系树,挖掘文本标签之间的关联关系;
4)针对每个图片视图,为图片标注文本标签;
5)为有关联关系的文本标签在不同图片视图中建立相似的标注结果;
6)为数据库中的每张图片标注与其有关联的多个文本标签。
步骤2)中所述的图片特征,包括:
1)提取图片的颜色直方图,得到256维的全局特征,并形成一个视图;
2)提取图片的SIFT特征点,并聚类得到500维的局部特征,并形成一个视图。
步骤3)中所述的文本标签关系树,包括:根据已知的文本标签分类,将属于同类的文本标签标记为类标签下的子标签,遍历所有类,建立文本标签关系树。
步骤5)中所述的有关联关系的文本标签,即在文本标签关系树中属于同一个父类的标签。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510169472.4/2.html,转载请声明来源钻瓜专利网。