[发明专利]为媒体文件添加标签方法和使用该方法的系统无效
申请号: | 201010127016.0 | 申请日: | 2010-03-18 |
公开(公告)号: | CN102193946A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | 刘媛;李滔;徐盈辉;陈义;张磊 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 黄小临 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体文件 添加 标签 方法 使用 系统 | ||
1.一种为媒体文件添加标签的方法,包括:
基于已有的含有标签的媒体文件的训练样本构建标签的检测模型,基于所述训练样本中标签的出现频率提取标签之间的共存系数;
输入媒体文件,并从所输入的媒体文件中提取视觉特征;
获取所输入的媒体文件的初始标签;
基于所述初始标签和所述训练样本中的标签之间的共存系数获取候选标签;
基于所输入的媒体文件的视觉特征以及共存系数,使用标签检测模型从所述候选标签中选择能够描述输入媒体文件的标签集合。
2.根据权利要求1所述的为媒体文件添加标签的方法,其中,所述基于已有的含有标签的媒体文件的训练样本构建标签的检测模型的步骤包括:
基于所述训练样本形成标签词典,并分别收集所述标签词典中的每一个具体标签所属的训练样本;提取所收集的训练样本的视觉特征;
基于所收集的训练样本以及所述训练样本的视觉特征,构建所述具体标签的检测模型,其中所构建的检测模型给出所述具体标签在一个媒体文件中的存在概率。
3.根据权利要求1所述的为媒体文件添加标签的方法,其中,所述基于所述训练样本中标签的出现频率提取标签之间的共存系数的步骤包括:
针对所有训练样本,统计两个标签存在于同一媒体文件中的数量,确定标签两两之间的共存频率;
针对所有训练样本,统计其中存在所述两个标签两者和两者之一的媒体文件的数量或者统计其中存在所述两个标签之中的一个标签的媒体文件的数量;
基于上述统计的媒体文件的数量,获得所述两个标签的共存系数。
4.根据权利要求1所述的为媒体文件添加标签的方法,其中所述获取所输入的媒体文件的初始标签的步骤可以通过以下方式之一来实现:
用户主动提供初始标签;
自动提取所输入的媒体文件自身携带的标签;
自动提取所输入的媒体文件自身携带的其他信息,并转化成标签形式;
利用所输入的媒体文件携带的其他信息,从第三方自动获取初始标签。
5.根据权利要求1所述的为媒体文件添加标签的方法,其中所述视觉特征包括但不限于:
媒体文件的颜色、纹理、边缘方向等低层特征;
媒体文件的创建环境、创建时间等高层特征。
6.根据权利要求1所述的为媒体文件添加标签的方法,其中所述使用标签检测模型从所述候选标签中选择能够描述输入媒体文件的标签集合的步骤包括:
基于所构建的标签检测模型,获得每个候选标签针对所输入的媒体文件的存在置信度;
基于所述标签之间的共存系数,获取候选标签的共存系数矩阵,其中矩阵的维度等于候选标签的数量;
基于所述候选标签的存在置信度和候选标签的共存系数矩阵,计算每个标签的针对所输入的媒体文件的存在得分,其中标签存在得分越大,该标签越能描述所述输入媒体文件的内容;
基于所述每个标签的存在得分,对所述候选标签的存在得分进行排序;以及
基于所述排序结果,选择适于描述所述输入媒体文件的一个或多个标签。
7.根据权利要求1所述的为媒体文件添加标签的方法,其中所述基于所述初始标签和所述训练样本中的标签之间的共存系数获取候选标签的步骤包括当所述初始标签为多个时,对应于所述多个初始标签中的每一个获取一个候选标签列表;以及
所述使用标签检测模型从所述候选标签中选择能够描述输入媒体文件的标签集合的步骤包括:
使用所构建的标签检测模型,获得每个候选标签列表中的每个候选标签针对所输入的媒体文件的存在置信度;
基于每个候选标签列表中的所述标签之间的共存系数,获取相应候选标签列表中的标签的共存系数矩阵,其中矩阵的维度等于相应候选标签列表中的标签的数量;
基于相应候选标签列表中的每个标签的存在置信度和所述标签的共存系数矩阵,计算相应候选标签列表中的每个标签的针对所输入的媒体文件的存在得分,通过累计相应候选标签列表中的每个标签的针对所输入的媒体文件的存在得分,获得相应候选标签列表的组合存在得分;其中候选标签列表的组合存在得分越大,该候选标签列表越能描述所述输入媒体文件的内容;
基于所述候选标签列表的组合存在得分,对所述候选标签列表的组合存在得分进行排序;以及
基于所述排序结果,选择描述所述输入媒体文件的候选标签列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010127016.0/1.html,转载请声明来源钻瓜专利网。