[发明专利]用于检索文档的系统、方法及用户接口无效
申请号: | 200710005435.5 | 申请日: | 2007-02-08 |
公开(公告)号: | CN101055580A | 公开(公告)日: | 2007-10-17 |
发明(设计)人: | 车完奎;金晶中;安汉峻 | 申请(专利权)人: | LG电子株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 隆天国际知识产权代理有限公司 | 代理人: | 郑小军 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检索 文档 系统 方法 用户 接口 | ||
技术领域
本发明涉及一种用于检索文档的系统和方法,其能够检索与用户输入的检索式具有预定相似度的文档;并且涉及一种为用户提供的用于检索相似文档的用户接口。
背景技术
近来,文档检索系统得到广泛使用,其能够处理大量的文档信息而只提取和提供用户需要的信息。
换句话说,文档检索或信息检索是指用户从大量的文档或信息中检索所需的文档或信息。为了检索文档或信息,处理自然语言文本的关键词,为每个关键词加权,并进行检索和排序。
现有技术的文档检索系统只接收用户的检索式(query)并向用户输出从普通系统提取的普通结果。由于一般检索系统按照从用户接收到的检索式的范围(area)来对文档进行分类,因此难以为用户提供针对其喜好和特点而定制的信息。
此外,由于现有技术的系统只根据用户输入的检索式来检索所需的信息,因此在确定检索范围时可能出现错误。因此,在用户所需的信息与检索结果之间可能产生差异,从而使检索结果的准确性和可靠性下降。
另外,由于现有技术的系统依赖于提供信息的站点所使用的检索系统来检索从用户接收到的检索式,因此检索到的信息缺乏准确性,并且难以提供实时信息。然而,对于应当在生成时尽快检索到或者应当在长时间过去之前检索到的文档(例如专利文档)而言,需要对所述文档的访问方法和针对用户定制的检索方法。
发明内容
因此,本发明旨在一种用于检索文档的系统、方法及用户接口,其充分消除了由于现有技术的限制和不足而引起的一个或多个问题。
本发明的一个目的是提供一种用于检索文档的系统、方法及用户接口,其能够通过各种路径输入检索式,例如输入句子和附上文件。
本发明的另一目的是提供一种于检索文档的系统、方法及用户接口,其能够使用检索到的文档作为检索式检索与所检索到的文档类似的其它文档。
本发明的其它优点、目的及特征将在以下说明书中阐明一部分,其另一部分对于本领域的技术人员而言可通过研究以下内容而清楚了解,或者通过实施本发明而获知。通过在文字说明书、权利要求书以及附图中所具体指出的结构,可以实现和获得本发明的目的和其它优点。
为实现这些目的和其它优点,并根据本发明的目标,如在此具体实施和广泛描述的,提供一种检索文档的系统,所述系统包括:文档数据库,其存储文档;文档特征编写单元,其提取存储在所述文档数据库中的文档的属性信息,并且基于所述属性信息编写所述文档的索引;检索式输入单元,其接收用户输入的检索式;关键词提取单元,其从所述检索式中提取关键词;加权单元,其使用所述索引对提取的关键词加权;文档检索单元,其使用已加权的所述关键词检索相似文档;以及输出单元,其将由所述文档检索单元检索到的相似文档显示给用户。
在本发明的另一方案中,提供一种检索文档的方法,所述方法包括如下步骤:通过检索式输入单元接收用户输入的检索式;从所述检索式中提取关键词;对每个关键词加权;以及基于已加权的关键词检索相似文档。这里,利用存储在文档数据库中的文档的特征信息的索引,对所述关键词加的权重反映每个文档中所述关键词的出现频率。
应当理解的是,本发明的以上概括说明和以下详细说明都是示意性的和说明性的,其旨在提供对请求保护的发明的进一步说明。
附图说明
附图用于提供对本发明的进一步理解,其包含在本申请中并构成本申请的一部分。附图示出本发明的实施例,并和说明书一起用于说明本发明的原理。在附图中:
图1为示出根据本发明实施例的文档检索系统的方框图;
图2为示出各文档的属性信息的视图;
图3为示出根据本发明实施例的第一用户接口的视图;
图4为示出一种用户接口的视图,所述用户接口示出提取的关键词和每个关键词的权重;
图5为示出提取的关键词的加权方法的流程图;
图6为示出第二用户接口的视图,所述第二用户接口作为针对用户输入的检索式相似文档的检索列表;
图7为示出使用检索到的文档检索相似文档的方法的流程图;
图8为示出根据本发明实施例的第三用户接口的视图;以及
图9为示出从附件提取关键词的过程的流程图。
具体实施方式
下面将详细介绍本发明的优选实施例,其实例在附图中示出。在所有附图中,尽可能地使用相同的标号表示相同或相似的部件。
图1为示出根据本发明实施例的文档检索系统的方框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于LG电子株式会社,未经LG电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710005435.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用对甲基苯磺酸催化合成阿魏酸单甘油酯的方法
- 下一篇:文档管理系统和方法