[发明专利]信息检索方法和系统有效
申请号: | 200810081556.2 | 申请日: | 2008-02-29 |
公开(公告)号: | CN101520785A | 公开(公告)日: | 2009-09-02 |
发明(设计)人: | 于浩;夏迎炬;骆卫华;刘群 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 黄纶伟 |
地址: | 日本神奈*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 检索 方法 系统 | ||
1.一种信息检索方法,根据用户输入的查询请求从大量信息构成的 信息集合中搜索所希望的信息,该方法包括以下步骤:
确定影响用户对信息与查询请求间的相关性判断的多个因素,作为 个性化特征;
对于各个个性化特征设定相关的权重,且分别基于各个所述个性化 特征建立反映用户的查询请求与信息集合中的信息之间的相关性的多个 检索模型,通过所述的权重将所述多个检索模型组合成用户兴趣模型;
接受用户的查询请求,分别通过各个所述的检索模型对所述信息集 合进行检索,分别生成一个有序信息列表;
通过所述的用户兴趣模型,计算每个所述检索模型得到的有序信息 列表中的每一条信息与所述查询请求的相关度;
根据所述用户兴趣模型输出的相关度,输出最终检索结果,
其中,分别通过各个所述的检索模型对所述信息集合进行检索包括:
第一检索模型基于查询语句和网页的纯文本特征进行检索;
第二检索模型在纯文本的基础上考虑时间因素进行检索;
第三检索模型利用命名实体识别获得的信息,利用向量空间模型进 行查询,以对原始网页序列中每个网页的次序进行调整;以及
第四检索模型对用户输入的查询语句进行扩展,把扩展结果和用户 输入的原始查询合并组成新的查询语句,然后进行检索。
2.根据权利要求1所述的信息检索方法,其特征在于,该方法进一 步包括以下步骤:
步骤2.1把所述权重设定为预定的值;
步骤2.2对于用户提交的多个查询请求,得到多个所述的最终检索 结果;
步骤2.3记录用户对于这多个最终检索结果的反馈,构造由正确匹 配的信息构成的训练集;
步骤2.4基于所述训练集,通过机器学习确定所述的权重。
3.根据权利要求2所述的信息检索方法,其特征在于,该方法进一 步包括以下步骤:
根据预定的条件,反复地执行所述步骤2.2至步骤2.4,从而更新所 述的权重。
4.根据权利要求1所述的信息检索方法,其特征在于,该方法进一 步包括以下步骤:
检测用户的个性化特征的改变或接受用户对个性化特征的修改;
接收用户对所述最终检索结果的反馈,构造由正确匹配的信息构成 的训练集;
计算所述最终检索结果与所述训练集之间的差异,调整所述权重, 使得所述最终检索结果与所述训练集之间的差异最小。
5.一种信息检索系统,其根据用户输入的查询请求从大量信息构成 的信息集合中搜索所希望的信息,该系统包括:
输入单元,其输入用户的查询请求;
多个检索单元,该多个检索单元分别针对预先确定的影响用户对信 息与查询请求相关性判断的多个个性化特征,根据不同的准则计算所述 查询请求与信息集合中的信息之间的相关度,根据所计算的相关度输出 一个有序信息列表;
用户兴趣单元,其通过规定的权重组合所述多个个性化特征,计算 每个所述检索单元得到的有序信息列表中的每一条信息与所述查询请求 的相关度;
输出单元,其根据所述用户兴趣单元计算的相关度,输出最终的检 索结果,
其中,所述多个检索单元包括:
第一检索模型,该第一检索模型基于查询语句和网页的纯文本特征 进行检索;
第二检索模型,其在纯文本的基础上考虑时间因素进行检索;
第三检索模型,其利用命名实体识别获得的信息,利用向量空间模 型进行查询,以对原始网页序列中每个网页的次序进行调整;以及
第四检索模型,其对用户输入的查询语句进行扩展,把扩展结果和 用户输入的原始查询合并组成新的查询语句,然后进行检索。
6.根据权利要求5所述的信息检索系统,其特征在于,该系统进一 步包括:
训练集构建单元,其对于用户提交的多个查询请求,得到多个所述 的最终检索结果,并记录用户对于这多个最终检索结果的反馈,构造由 正确匹配的信息构成的训练集;
训练单元,其基于所述训练集,通过机器学习确定所述的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810081556.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:进化驱动型产品创新设计方法和系统
- 下一篇:文本可理解性的度量方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置