[发明专利]进行非结构化信息管理和自动文本分析的系统和方法有效
申请号: | 200410045899.5 | 申请日: | 2004-05-25 |
公开(公告)号: | CN1573744A | 公开(公告)日: | 2005-02-02 |
发明(设计)人: | 安德雷·Z·布拉德;戴维·卡梅尔;迈克尔·赫斯克维奇;阿雅·索弗;贾森·泽恩 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 李春晖 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及进行非结构化信息管理和自动文本分析的系统和方法。具体地,本发明公开了一种用于非结构化信息管理系统(UIMS)的系统架构、部件和搜索技术。UIMS可以作为中间件提供,用于在信息源的广泛阵列上有效地管理和交换非结构化信息。所述架构通常包括一个搜索引擎、数据存储器以及包含流水线化文档标注器和各种适配器的分析引擎。该搜索技术利用二级搜索技术。一个搜索查询包括一个搜索操作符,该操作符包括多个搜索子表达式,每一个子表达式具有相关的权重值。搜索引擎将权重值和大于权重值和阈值的文档返回。所述搜索操作符被实现为按照加权与(WAND)工作的布尔判定。 | ||
搜索关键词: | 进行 结构 信息管理 自动 文本 分析 系统 方法 | ||
【主权项】:
1.一种用于处理存储的数据的数据处理系统,包括:用于存储数据单元的集合的数据存储器;和连接到该数据存储器的搜索引擎,该搜索引擎对用于从所述数据存储器中检索至少一个数据单元的查询作出响应;其中所述查询包括一个搜索操作符,该操作符由多个搜索子表达式构成,每一个子表达式有一个相关的权重值,并且,其中,所述搜索引擎将权重值和大于一个权重值和阈值的数据单元返回。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200410045899.5/,转载请声明来源钻瓜专利网。