[发明专利]信息处理有效

专利信息
申请号: 200810128758.8 申请日: 2008-05-09
公开(公告)号: CN101308514A 公开(公告)日: 2008-11-19
发明(设计)人: N·P·罗斯 申请(专利权)人: 索尼英国有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中国专利代理(香港)有限公司 代理人: 张雪梅;刘春元
地址: 英国威*** 国省代码: 英国;GB
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息处理
【说明书】:

技术领域

发明涉及信息处理。 

背景技术

从资产管理系统对媒体内容项,例如音频项和/或视频项进行识别和检索是长期存在的问题。通常数字音频/视频文件不具备关联的文本元数据,并且甚至文件名也可能仅仅是对于人类用户来说无意义的识别码。 

已经提出了一些系统,它们试图允许用户通过识别所关心项目的视频和/或音频统计信息(statistics)来搜索内容库,并在库中搜索相似内容项。这样的统计信息经常被称为“底层实况(ground truth)”元数据,这是因为它们是从所述内容的视频和音频属性中以一种可重复的方式导出的。上述搜索能通过为每个可用内容项定义一个特征向量(根据底层实况元数据的至少一组重要方面),并根据向量空间内的距离检测接近匹配而执行。这类搜索可以返回一个信息子集,用户能从其中主观地确定哪个与他的需求相关。已经提出用户可以自主地选择相关的命中,并返回库中交叉搜索它们的特征向量以查找进一步的相似内容项或命中。这将被称为“增强查找相似”搜索。 

一些资产管理库可能包括具有关联的文本元数据(textualmetadata)的内容项,而同一库中的其它项则没有关联的元数据。新的内容项可能被带有或不带有关联的文本元数据地摄入。依据底层实况元数据的搜索,可用于生成可用内容项的视觉表示,以向用户提供关于该库中保存的内容类型的认识。用户可以从这种可视化中选择多个候选项,并在那些所选择的候选项上执行关键词搜索以查找所需的内容项。很显然,那些没有文本元数据的项仅能从该可视化搜索中被识别为相关。已经提出当将不具有关联的文本元数据的新内容项摄入到库中时,可以导出该新内容项的特征向量,并在资产管理系统中搜索该特征向量以识别类似的内容项。例如,可以识别向量空间中与该新项最接近的匹 配,并且如果它有关联的文本元数据,则该元数据可以被自动地分配给该新内容项。从而,可以通过文本元数据搜索识别该新内容项,而无需人的烦累劳动来检查它并人工地分配元数据给它。 

当然,这样会有一些缺陷,正如经常地,分配给新内容项的元数据不会是完全精确的。例如库可能包括赛道上的赛车的大量镜头,并且每辆赛车都有一元数据,该元数据将其定义为一级方程式赛车(A)。也可能存在停放在街道边的摩托车的大量镜头,具有将镜头定义为摩托车的元数据(B)。如果摄入新的、赛道上的超级摩托车比赛的镜头(C),那么自动系统可能由于赛道的存在而确定(A)比(B)相对更类似于(C)。在此情况下,(C)将被错误地赋予元数据“一级方程式赛车”而不是“摩托车”。发生这种情况的风险,可以通过确保仅当类似项被识别在向量空间内的阈值距离之内才分配元数据而减少。替代地,系统可以识别例如,20个最接近的项并处理它们的元数据以确定单个单词或短语的词语频率,并例如,将最高的三个单词/短语分配给该新摄入的内容项。 

尽管如此,这对于数据库管理将是十分危险的策略,并且会导致许多被错误标记的项。此外如果这些被错误标记的项自身被错误地用于自动地增加到(populate)新摄入的项,结果将是不合意的数据库。 

本发明的一个目的是为了缓解或减轻上述问题。 

发明内容

本发明提供信息处理装置,其中通过参考具有相关联的元数据的信息项的集合(ensemble),生成关于当前信息项的元数据(例如文本元数据),所述元数据具有对应的指示器数据(indicator data),表示与该元数据相关联的可信度,装置包括:用于检测当前信息项的一个或多个预定属性的检测器;用于从信息项的集合中检测信息项的子集的检测器,所述子集是具有与当前信息项的预定属性最相似的所述一个或多个预定属性的那些信息项;关联逻辑,配置为将来自信息项的所述子集中一个或多个的元数据与当前信息项相关联,使得在所述元数据与当前信息项的关联中,与当前信息项相关联的元数据被分配表示低可信度的指示器数据;和用于检测与信息项及其相关联的元数据相关的与装置的用户交互并且用于响应这样的用户交互修改与元数据相关联的指示器数据的检测器。 

根据本发明的实施例,并且承认上述问题,执行这样的自动元数据标记,并且在数据库结构内,定义一个域,通过该域可以输入元数据(优先为自动地,或可能人工地),该域指示元数据准确性的相对可信度。这例如可以在1到10的数值范围上,其中1指示未证实的准确性,而10指示在准确性方面的高可信度。替代地,它可以是简单的双状态信任或不信任标志。一旦有人验证了该元数据的准确性,这样的标志就可以被改变。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼英国有限公司,未经索尼英国有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810128758.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top