[发明专利]设置元数据的方法、设置元数据的系统以及程序有效
申请号: | 201080043084.7 | 申请日: | 2010-09-30 |
公开(公告)号: | CN102576362A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 野崎康行;松本俊子;大峡光晴 | 申请(专利权)人: | 株式会社日立解决方案 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 周靖;郑霞 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 设置 数据 方法 系统 以及 程序 | ||
技术领域
本发明涉及用于设置元数据的方法、用于设置元数据的系统、以及程序。例如,本发明涉及用于在搜索电子数据的过程期间提供元数据的方法。
背景技术
在许多组织例如企业中,大量的数据,例如用办公软件创建的文件或通过扫描书面文件创建的文件,被每天创建并且存储在文件服务器或类似物中。当期望的文件将要位于这样大量的数据中时,普遍使用了在文件服务器中搜索文件夹的方法。
然而,当文件夹结构复杂或当文件放在具有不是搜索期望的文件的人所意想的结构的文件夹中时,定位这样的文件将耗费相当长的时间。作为另一种搜索文件的方法,已知全文搜索方法。然而,这种方法至少存在两个问题。第一个问题是,某些文件不能够仅通过关键词搜索被定位(见图1)。例如,当想要定位在给定的时间段创建的所有文档时,检索这样的文档将是不可能的,因为全文搜索不能够将表示文档内的日期的字符串作为“与日期相关联的数据”对待。此外,作为其他的示例性的问题,可能有以下的情况,如果某些文档包含具有与搜索期望的文档的人使用的搜索关键词相同的含义的词语,那么所期望的文档不能够被定位,或如果客户名称在多行中描述,那么将不能找出包含客户名称的文件,即使通过客户名称(作为位于多行中的字符串)执行搜索。作为另一个问题,可能有大量无关的文件被找出的情况(见图2)。例如,如果执行搜索以定位其中将银行名称作为客户名称描述的文档,在另一个文件中,银行名称也可能作为过户账户名称描述,或如果通过ID例如报价数字执行搜索,那么与ID相同的数字可能被作为金额描述。这样的可归因于全文搜索的问题可能发生,因为在文档内的关键词不被作为具有含义的字符处理。
在本文中,已知使用与文档相关联的元数据(属性信息)来管理文档的方法。例如,专利文献1提出了虚拟文件夹系统。虚拟文件夹系统通过设置每个文件上的元数据并且定义搜索条件以定位在每个虚拟文件夹中的每个元数据来实现。当查阅虚拟文件夹时,相应于相关联的搜索条件的文件搜索结果被呈现,由此实现了基于搜索条件的文件分类。例如,当管理商业文档时,“文档类型名称”(例如合同、订单或报价单)和“开具日期”被设置作为所有文件的元数据,并且虚拟文件夹被指定搜索条件:“文档类型名称:‘合同’”。然后,当查阅虚拟文件夹时,可以获取合同的列表。相似地,如果另一个虚拟文件夹被指定搜索条件:“开具日期:‘2009年1月至3月’”,那么可以收集在指定的时期发布的文档。如上文描述的,虚拟文件夹系统通过含义来分类文件。因此,文档的有效使用是可能的。
当设置文档上的元数据时,用户参照原始文档进行设置。许多文档管理产品提供元数据注册屏幕,使得用户参照文件手工键入元数据。作为用于减少这样的手工录入操作的负担的方法,例如,已知在专利文献2中提出的方法,其中当新的文件存储在其中已经存储有另一个文件的文件夹中时,与已经存储的文件的元数据相同的元数据被自动设置在新注册的文件上。此外,专利文献3提出了当意图在(表示其元数据已经被注册的文件的)小图像中注册的文件被拖放至小图像时,用于自动在新注册的文件上设置已经注册的元数据的方法。此外,专利文献4提出了用于通过参照文档内的句子的内容和布局之间的关系自动地从文档抽取元数据的技术。
引用列表
专利文献
特许文献1:日本专利公布(特开昭)No.2003-323326A
特许文献2:日本专利公布(特开昭)No.2009-75667A
特许文献3:日本专利公布(特开昭)No.2006-209516A
特许文献4:日本专利公布(特开昭)No.2005-235099A
发明概述
技术问题
根据专利文献2至4,虽然元数据录入操作的负担减少了,但是不能消除在注册之前通过视觉检查待注册的目标文档的需要。例如,根据专利文献2和3,必需在选择合适的现有文件或用于文档的注册的小图像之前检查待注册的目标文档的内容。此外,根据专利文献4,不一定的是,正确的元数据可以始终被抽取。因此,在实践中,必需视觉地检查元数据是否是正确的,并且,如果发现元数据是不正确的,修改这样的元数据。即,在注册元数据时,人应当始终参照最初的文件并且检查与其相关联的元数据。
然而,这样的检查操作对于用户来说是复杂的和繁琐的。由于该原因,某些用户可能会倾向于在文件服务器中注册文件而不设置其上的元数据,使得基于元数据的文件的有效使用将是不可能的。
本发明鉴于以上问题而作出。本发明提供用于在搜索文件的日常过程中自然和高效率地设置元数据的技术。
问题的解决方案
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立解决方案,未经株式会社日立解决方案许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080043084.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置