[发明专利]信息检索方法和系统有效

专利信息
申请号: 200810081556.2 申请日: 2008-02-29
公开(公告)号: CN101520785A 公开(公告)日: 2009-09-02
发明(设计)人: 于浩;夏迎炬;骆卫华;刘群 申请(专利权)人: 富士通株式会社
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京三友知识产权代理有限公司 代理人: 黄纶伟
地址: 日本神奈*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息 检索 方法 系统
【权利要求书】:

1.一种信息检索方法,根据用户输入的查询请求从大量信息构成的 信息集合中搜索所希望的信息,该方法包括以下步骤:

确定影响用户对信息与查询请求间的相关性判断的多个因素,作为 个性化特征;

对于各个个性化特征设定相关的权重,且分别基于各个所述个性化 特征建立反映用户的查询请求与信息集合中的信息之间的相关性的多个 检索模型,通过所述的权重将所述多个检索模型组合成用户兴趣模型;

接受用户的查询请求,分别通过各个所述的检索模型对所述信息集 合进行检索,分别生成一个有序信息列表;

通过所述的用户兴趣模型,计算每个所述检索模型得到的有序信息 列表中的每一条信息与所述查询请求的相关度;

根据所述用户兴趣模型输出的相关度,输出最终检索结果,

其中,分别通过各个所述的检索模型对所述信息集合进行检索包括:

第一检索模型基于查询语句和网页的纯文本特征进行检索;

第二检索模型在纯文本的基础上考虑时间因素进行检索;

第三检索模型利用命名实体识别获得的信息,利用向量空间模型进 行查询,以对原始网页序列中每个网页的次序进行调整;以及

第四检索模型对用户输入的查询语句进行扩展,把扩展结果和用户 输入的原始查询合并组成新的查询语句,然后进行检索。

2.根据权利要求1所述的信息检索方法,其特征在于,该方法进一 步包括以下步骤:

步骤2.1把所述权重设定为预定的值;

步骤2.2对于用户提交的多个查询请求,得到多个所述的最终检索 结果;

步骤2.3记录用户对于这多个最终检索结果的反馈,构造由正确匹 配的信息构成的训练集;

步骤2.4基于所述训练集,通过机器学习确定所述的权重。

3.根据权利要求2所述的信息检索方法,其特征在于,该方法进一 步包括以下步骤:

根据预定的条件,反复地执行所述步骤2.2至步骤2.4,从而更新所 述的权重。

4.根据权利要求1所述的信息检索方法,其特征在于,该方法进一 步包括以下步骤:

检测用户的个性化特征的改变或接受用户对个性化特征的修改;

接收用户对所述最终检索结果的反馈,构造由正确匹配的信息构成 的训练集;

计算所述最终检索结果与所述训练集之间的差异,调整所述权重, 使得所述最终检索结果与所述训练集之间的差异最小。

5.一种信息检索系统,其根据用户输入的查询请求从大量信息构成 的信息集合中搜索所希望的信息,该系统包括:

输入单元,其输入用户的查询请求;

多个检索单元,该多个检索单元分别针对预先确定的影响用户对信 息与查询请求相关性判断的多个个性化特征,根据不同的准则计算所述 查询请求与信息集合中的信息之间的相关度,根据所计算的相关度输出 一个有序信息列表;

用户兴趣单元,其通过规定的权重组合所述多个个性化特征,计算 每个所述检索单元得到的有序信息列表中的每一条信息与所述查询请求 的相关度;

输出单元,其根据所述用户兴趣单元计算的相关度,输出最终的检 索结果,

其中,所述多个检索单元包括:

第一检索模型,该第一检索模型基于查询语句和网页的纯文本特征 进行检索;

第二检索模型,其在纯文本的基础上考虑时间因素进行检索;

第三检索模型,其利用命名实体识别获得的信息,利用向量空间模 型进行查询,以对原始网页序列中每个网页的次序进行调整;以及

第四检索模型,其对用户输入的查询语句进行扩展,把扩展结果和 用户输入的原始查询合并组成新的查询语句,然后进行检索。

6.根据权利要求5所述的信息检索系统,其特征在于,该系统进一 步包括:

训练集构建单元,其对于用户提交的多个查询请求,得到多个所述 的最终检索结果,并记录用户对于这多个最终检索结果的反馈,构造由 正确匹配的信息构成的训练集;

训练单元,其基于所述训练集,通过机器学习确定所述的权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810081556.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top