[发明专利]基于分类的可扩展交互式文档检索系统无效
申请号: | 01823447.X | 申请日: | 2001-07-04 |
公开(公告)号: | CN1535433A | 公开(公告)日: | 2004-10-06 |
发明(设计)人: | 弗兰克·梅克;迈克尔·维尔舍茨 | 申请(专利权)人: | 库吉萨姆媒介公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 李辉 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种集成、自动且开放的信息检索系统(100),其包括基于自动文本分类的语言学和数学方法的混合方法。该系统通过把自动内容识别技术和索引分类的自学习层级方案结合在一起来解决传统系统的问题。响应于请求者提交的单词,所述系统(100)搜索含有该单词的文档,分析这些文档以确定它们的单词配对模式,把这些文档模式与和各个主题相关的数据库模式进行匹配,从而为各个文档指派主题。若所搜索的文档被指派给多于一个主题,则向请求者提供文档主题列表,并且请求者指定相关主题。然后,只允许请求者访问指派到相关主题的文档。为加速将来的搜索,建立并维护将搜索项链接到文档和将文档链接到主题的知识库(1408)。另外,还提供了新的策略,以应付网站的不同更新频率。 | ||
搜索关键词: | 基于 分类 扩展 交互式 文档 检索系统 | ||
【主权项】:
1.一种交互式文档检索系统(100),其被设计用来在接收到来自请求者的搜索查询后搜索文档,所述系统包括:包含将文本模式与主题联系起来的至少一个数据结构(202、208、210、212、214、216和/或218)的知识库(200);和查询处理器(400),其响应于接收到来自请求者的搜索查询,执行以下的步骤:-搜索并试图获得含有至少一个与搜索查询相关的搜索项的文档,如果获得任何文档,则-分析所获得的文档,以确定它们的文本模式;-通过将各个文档的文本模式与知识库(200)中的文本模式进行比较,对所获得的文档进行分类;-如果文档的文本模式与知识库(200)中的文本模式相似,则将该文档指定为该相似单词模式的相关主题,-向请求者提供指派给所分类文档的至少一个主题列表,并且-要求请求者从该列表中指定至少一个主题,作为与请求者的搜索相关的主题,以及-允许请求者访问所获得的并已指派了由请求者所指定的主题的分类文档的子集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于库吉萨姆媒介公司,未经库吉萨姆媒介公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/01823447.X/,转载请声明来源钻瓜专利网。
- 上一篇:浮置栅极存储单元及其制造方法
- 下一篇:网络中设备状态的检测方法