[发明专利]信息检索方法和系统有效

专利信息
申请号: 200810081556.2 申请日: 2008-02-29
公开(公告)号: CN101520785A 公开(公告)日: 2009-09-02
发明(设计)人: 于浩;夏迎炬;骆卫华;刘群 申请(专利权)人: 富士通株式会社
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京三友知识产权代理有限公司 代理人: 黄纶伟
地址: 日本神奈*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息 检索 方法 系统
【说明书】:

技术领域

本发明涉及信息检索,更具体地,涉及自适应的个性化信息检索。

背景技术

随着因特网和大容量存储设备等的迅速发展,世界进入了信息过剩 的时代。如何从海量的信息中获取有用的信息,成为人们关心的问题。

目前,解决这一问题最常见的方法是搜索引擎。通过目前商用的以 Google、百度为代表的搜索引擎,可以得到基本上令人满意的搜索结果。

然而,与人们对于有效信息获取的需求相比,目前的搜索引擎提供 的结果还远远不能满足要求。这首先体现在,现有的搜索引擎获取用户 信息的手段比较单一,主要采用基于关键词的布尔表达式作为输入。因 此,搜索引擎很难准确理解隐含在这些关键词之后的用户真实信息需求。 更重要的是,现有的搜索引擎采用与用户无关的通用搜索算法,不论用 户是谁,不论用户来自何方,只要输入的查询语句相同,返回的结果都 是相同的。而事实上,用户的需求非常个性化。例如一个旅游者和一个 程序员在输入“Java”时,前者想搜索与爪哇岛相关的旅游资讯,而后者 想要找与Java编程语言相关的信息。但目前常见的搜索引擎都对这种情 况不加区分。因此,对于那些与用户的个性化需求密切相关的信息需求, 目前的搜索引擎就不太适用了。此外,对于用户的某个长期感兴趣的话 题,如果要用搜索引擎来查找信息,那么就要反复地到搜索引擎上输入 相同的关键词,然后每次都从大量的网页中去查找其中新出现的相关信 息,这显然大大加重了用户的使用负担。此外,虽然用户的个性化信息 需求在一段时间内是稳定的,但长期来看,这种信息需求还是会有所改 变的。显然,采用上述方法无法捕捉这种变化。

自适应的个性化信息检索研究,目标是满足用户个性化和持续关注 型的信息需求。该项研究根据用户的兴趣和关注点的不同,通过对无关 信息的过滤,向用户提供最有价值的信息。它能够满足用户的个性化信 息需求,通过长期观察用户的搜索行为,从中识别用户的信息需求偏好, 并且能够根据用户对搜索结果的评价,自动调整搜索策略,使得对于同 一检索请求,不同用户能够得到最贴近自己需求的信息。

在目前个性化信息检索的研究中,比较流行的上下文检索,相对于 传统的信息检索方法,能够针对不同的用户提供更加个性化的结果。总 体而言,这些方法的思想大多可以概括如下:要求用户输入比关键词更 复杂的查询语句,把每一个查询输入视为一个兴趣,利用这些输入构造 用户兴趣模型,基于查询语句中的关键词,使用传统的信息检索算法得 到初始网页列表,然后利用用户兴趣模型对此列表进行过滤。如果用户 对结果进行直接反馈,则根据这些反馈对用户模兴趣型进行调整,并基 于新的用户兴趣模型对网页列表进行过滤。

例如,在非专利文献1中,采用经典的向量空间模型来对上下文进 行建模,但这种方法基本上借用的都是文本信息,而其他非文本信息基 本上无法纳入这个框架。

在非专利文献2中,将上下文检索任务看作一个决策问题,把用户 查看的文档、以往的查询历史等上下文信息与查询和文档综合在一起来 优化对检索结果的判定,但这项工作只考虑了几种易于表示的特征,而 且把这些特征在分类算法的框架里固定了下来,难以扩展,也没有提及 当用户兴趣发生改变时如何捕捉这种变化。

在非专利文献3中,则采用基于Ontology的方法,将用户上下文表 示成Ontology上的一个向量,并把上下文预测的结果与传统的信息检索 算法所得的结果用一个线性函数组合起来,从而得到最终的个性化的结 果,但Ontology的构造需要较为专业的知识,而且还需要大量人力物力, 即便如此,所能覆盖的知识体系也是很有限的。

在专利文献1中,提出了一种采用用户模型根据与相应用户特征相 关的信息来个性化一般查询和/或搜索结果的系统和方法,该专利同样列 举了目前可能与个性化检索相关的特征,这些特征是预先划定的一个范 围,而不是一个可以考虑任何特征的完全泛化的框架。

在专利文献2中,提出了一种利用用户概况排序搜索引擎返回的搜 索结果中的放置内容的系统和方法,但这种方法同样设定了可能有作用 的个性化特征的范围,而且没有使用机器学习方法来确定各种特征对最 终结果的影响,此外,也没有考虑用户对结果的反馈的处理。

综上,目前现有的个性化信息检索技术存在以下不足之处:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810081556.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top