[发明专利]信息检索系统无效

专利信息
申请号: 01118060.9 申请日: 2001-05-17
公开(公告)号: CN1324046A 公开(公告)日: 2001-11-28
发明(设计)人: 内藤荣一;荒木昭一;九津见洋;小泽顺;丸野进 申请(专利权)人: 松下电器产业株式会社
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中科专利商标代理有限责任公司 代理人: 汪惠民
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息 检索系统
【说明书】:

发明涉及一种能够从大量的信息中利用者容易发现所需求的信息的信息检索系统。

近年,随着互联网的普及,在WWW(World Wide Web)上登载有由HTML(Hyper Text Markup Language)记述的各种各样的首页,一般利用者需要处理大量的信息的时代已经到来。另外,公开有称为FAQ(FrequentlyAsked Questions)集的、针对频繁询问和解答的列表,利用者可以得到有关询问的解答。这些信息,对于利用者来说,如果知道所需求的信息的所在就可以立即阅览,非常方便,相反如果要从大量的信息中发现自己所需要的信息将是一件件难的事情。

为此,产生了从文档中选出关键词作为该文档的特征量,计算出特征量的内积求出为文挡间的近似度,检索针对询问的近似文档的检索技术。

但是,由于互联网上的信息或者在事例基础上积蓄的FAQ集是向很多人独立提供信息,不能避免信息的重复,大量存在具有相同内容的文档。因此,在现有技术中,作为类似于询问文的文档,结果检索出大量具有相同内容的文档,而利用者仍然需要从大量的检索结果中找出自己需要的信息的作业。如果将检索结果限制在一定数量内,又可能没有自己所需要的信息,这成为检索技术的课题。

另外,即使利用者成功地从检索结果中找出了自己希望的信息,由于在FAQ集中没有反应,其他利用者在相同条件下检索时需要同样的手续。在避免信息的重复的同时进一步充实FAQ集,必须要检查同样的信息是否存在,成为信息提供者的负担。

本发明的目的在于提供一种可以减轻利用者的信息检索的负担的信息检索系统。

本发明的另一目的在于提供一种容易更新检索对象的信息的信息检索系统。

为了达成上述目的,本发明的信息检索系统,计算文档的特征矢量,根据特征矢量对文档进行簇分类,将文档的检索结果按簇归类进行显示。这样,把检索结果为相似文档的集合,利用者容易把握。

另外,本发明的信息检索系统,当利用者输入询问时检索相似询问,将对应的回答向利用者或者专家提示,利用者或者专家选择了认为最恰当的回答时,以该选择的回答为基础自动更新文档数据库。如果没有恰当的回答,以专家输入的回答为基础自动更新文档数据库。这样,当下次输入了同样的询问时就可以适合的回答了。

下面对附图进行简要说明。

图1为表示本发明实施例的信息检索系统的构成的方框图。

图2为表示图1所示的文档存储部中所保存的文档例的图。

图3为表示图1所示的利用者显示部中检索结果的显示例的图。

图4为表示图1所示的特征矢量抽出部的处理顺序的流程图。

图5为表示所抽出的文档特征矢量例的图。

图6为表示图1所示的簇分类部的处理顺序的流程图。

图7为表示簇分类结果例的图。

图8为表示图1所示的簇标签作成部中单词标签作成顺序的流程图。

图9为表示作成的单词标签例的图。

图10为表示图1所示的簇标签作成部中文标签作成顺序的流程图。

图11为表示作成的文标签例的图。

图12为表示图1所示的文档标签作成部的处理顺序的流程图。

图13为表示作成的文档标签例的图。

图14为表示本发明实施例2的信息检索系统的构成的方框图。

图15为表示图14所示的文档存储部中所保存的文档中询问表部分例的图。

图16为表示图14所示的文档存储部中所保存的文档中回答表部分例的图。

图17为表示图14所示的专家显示部中检索结果的显示例的图。

图18为表示图14所示的利用者显示部中检索结果的显示例的图。

图19为表示图14所示的特征矢量抽出部中利用者询问的特征矢量抽出顺序的流程图。

图20为表示从利用者询问中抽出的特征矢量例的图。

图21为表示图14所示的近似度运算部的处理顺序的流程图。

图22为表示以图14所示的数据库检索更新部的处理顺序为主的流程图。

以下参照附图说明本发明的2个实施例。

实施例1

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/01118060.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top