[发明专利]用于处理并管理与对象相关的数据以供多个应用程序使用的系统及方法有效
申请号: | 201010536654.8 | 申请日: | 2010-11-05 |
公开(公告)号: | CN102054022A | 公开(公告)日: | 2011-05-11 |
发明(设计)人: | R·斯特灵厄姆;E·苏亚雷斯 | 申请(专利权)人: | 赛门铁克公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 管理 对象 相关 据以 供多个 应用程序 使用 系统 方法 | ||
背景技术
在一个系统上存在着多个从计算机文件中收集数据并对其进行标引的软件应用程序。例如,搜索引擎经常对来自多个文件的数据进行标引,并且使用经标引的数据在这些文件中快速地搜索特定的文件内容。用于防止数据丢失、垃圾邮件过滤、内容管理、归档、以及备份目的的不同的应用程序也可以在一个系统上生成并使用文件的索引。经常,使用一个文件索引的每个应用程序必须与其他程序分别地生成该文件索引。因此,一个系统上的多个不同的应用程序可以各自对相同的程序文件进行标引。
虽然文件索引可以使多个进程(如搜索)能够以一种有效率的方式来进行,但是创建这些文件索引经常使用大量的处理资源。许多文件不能被直接分析来创建一个索引。相反,这些文件必须首先被转换为一种常用的格式,如HTML或纯文本。因此,运行不同标引程序的一个系统可能浪费时间和资源来在不同的应用程序上多次标引不同的系统文件。这些标引进程还可能显著地消耗系统带宽以及输入/输出性能。因此,本披露识别并着手解决对于在一个系统上由多个应用程序执行的多种标引功能进行强化的系统及方法的需要。
发明内容
如以下将更详细说明的,本披露总体上涉及用于进行数据标引以供多个应用程序使用的系统及方法。根据某些实施方案,一种用于进行数据标引以供多个应用程序使用的计算机实施的方法可以包括在多个应用程序中的一个第一应用程序处接收一个数据对象;将该数据对象令牌化以便从该数据对象中提取多个令牌;创建从该数据对象中提取的这些令牌的一个索引(该索引被格式化为供该多个应用程序中的每一个使用);并且将该索引存储到该多个应用程序可以访问的一个数据库中。该多个应用程序可以包括两个或更多个应用程序的类型。常用形式的数据对象可以包括标记语言(例如,HTML或XML)和/或纯文本中的至少一个。
在一些实施方案中,这种数据对象可以包括被配置为被至少一种程序类型访问的一种程序专用的数据对象,并且该方法可以进一步包括将该程序专用的数据对象转换为一种常用形式的数据对象。该方法还可以包括从该多个应用程序中的一个第二应用程序接收对于该索引的一个请求并且允许该第二应用程序访问该数据库。
该方法可以进一步包括生成与该程序专用的数据对象相关联的元数据和/或与该程序专用的数据对象相关联的一个隐藏文件中的至少一项。该方法还可以包括执行该程序专用的数据对象的一个数据分类,并且将这些数据分类结果与该常用形式的数据对象和/或该索引中的至少一项相关联。在至少一个实例中,将这些数据分类结果与该常用形式的数据对象相关联可以包括创建指代这些数据分类结果的数据标签。在一些实例中,执行该数据分类可以包括基于标引的元数据、标引的内容、提取的模式、和/或提取的实体中的至少一项对该程序专用的数据对象中的数据进行分类。
根据一些实施方案,该方法可以进一步包括基于该程序专用的数据对象的数据分类执行至少一个策略。该至少一个策略可以包括垃圾邮件策略、防病毒策略、防止数据丢失策略、防止知识产权泄漏策略、归档策略、备份策略、内容管理策略、遵守法律策略、和/或电子采证策略中的至少一项。在一些实例中,该多个应用程序的类型可以包括搜索引擎、归档应用程序、防止数据丢失应用程序、垃圾邮件过滤应用程序、防病毒应用程序、备份应用程序、内容管理应用程序、遵守法律应用程序、和/或电子采证应用程序中的两项或更多项。
根据不同的实施方案,该第一应用程序可以执行以下至少一项:将该程序专用的数据对象转换为该常用形式的数据对象;将该常用形式的数据对象令牌化;创建该索引;执行该程序专用的数据对象的数据分类;和/或在该常用形式的数据对象上执行语言检测。在一些实例中,该第一应用程序可以指示一个第三应用程序执行以下至少一项:将该程序专用的数据对象转换为该常用形式的数据对象;将该常用形式的数据对象令牌化;创建该索引;执行该程序专用的数据对象的数据分类;和/或在该常用形式的数据对象上执行语言检测。
在不同的实例中,该方法可以包括执行以下至少一项:该数据对象上的语言检测、该数据对象上的模式检测、和/或该数据对象上的实体提取。该方法可以额外地包括从该多个应用程序中的一个第二应用程序接收对于该索引的一个请求并且允许该第二应用程序访问该索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛门铁克公司,未经赛门铁克公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010536654.8/2.html,转载请声明来源钻瓜专利网。