[发明专利]交叉描述符学习系统、方法及其程序产品有效
申请号: | 200680017045.3 | 申请日: | 2006-01-06 |
公开(公告)号: | CN101213539A | 公开(公告)日: | 2008-07-02 |
发明(设计)人: | 米林德·R·纳费德;颜嵘 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F15/18 | 分类号: | G06F15/18 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 黄小临 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交叉 描述 学习 系统 方法 及其 程序 产品 | ||
政府权利
本发明在政府支持下,依照由DST/ATP/合同授予的合同号:2004*H839800*000完成。政府对此发明享有一定权利。
技术领域
本发明一般涉及信息管理并且更具体地,涉及松散(unstructured)信息管理和自动元数据丰富(enrichment)。
背景技术
管理松散的数据内容和信息已经日益要求某些类型的语义检测和索引能力。结果,典型的最新技术水平的内容管理系统日益依赖机器学习和分类技术。这些最新技术水平的机器学习和分类技术不同程度地依赖于人的介入以便在使用前和有时在使用期间构造检测器(即,教系统如何分类)。同样,可以将机器学习和分类技术分类为监督的、半监督的或无监督的。例如,监督的机器学习和分类从迭代地分类已知的例子或有标签的样本开始。半监督的机器学习和分类使用有标签的样本和无标签样本这二者。无监督的机器学习和分类使用无标签样本。然而,无论监督的还是无监督的,此种典型的技术依赖于人的介入或反馈来训练该分类器以达到可接受的结果。
无论监督的还是无监督的,学习和分类技术在构造语义检测器时可能要求相当多的监督,但是在检测期间并不需要学习部件。公知的相关性反馈技术的特征可在于非持久轻量级二进制分类器,其使用增量训练来提高分类/检索性能。相关性反馈分类器精度取决于提供的样本的数目、分类器接收的反馈的级别和训练花费的时间量。例如,统计语义建模相对于从轻量级分类器到重量级分类器的旧的相关性反馈技术已经显著地减少所需的人工监督的级别。不幸的是,这些训练分类器的现有技术可能是耗时和昂贵的任务。因而,这些技术在训练期间消耗大量的宝贵的注释时间并且要求相当重的注释工作以实现可接受的注释质量。结果,在机器学习和分类中,尤其是对于最新技术水平的媒体索引和检索,减少人的介入已经日益变得重要。
因而,为了减少人的介入时间,在注释期间消除二义性(disambiguation)已经被广泛地应用。此外,利用在注释期间选择采样中扮演很积极的角色的系统的积极学习已经最大化消除二义性并减少了必须被注释的采样的数目的量级。例如见M.Naphade et al.″Learning to Annotate Video Databases,″Proc.IS&T/SPIE Syrnp.on Electronic Imaging.Science and Technology-Storage&Retrieval for Image and Video Databases X,San Jose,CA,Jan.2002)。被称为多实例学习的用于具有区域支持的概念的正交办法接受粗糙粒度的注释。例如,用户可通过在对应于区域标签的图像中选择区域而建立区域概念(如天空)的模型。一旦已经选择区域概念,则系统就从几个可能肯定的和否定的已注释例子中学习如何使用区域特征表示该概念。见A.L.Ratan,O.Maron,W.E.L.Grimson,和T.Lozano Prez.A framework for learning query concepts in imagec/assification.In CVPR,pp.423-429,1999。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680017045.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:全向灯
- 下一篇:三自由度反射镜调整装置