[发明专利]一种过滤搜索引擎查询结果的方法有效
申请号: | 200710118084.9 | 申请日: | 2007-06-28 |
公开(公告)号: | CN101334773A | 公开(公告)日: | 2008-12-31 |
发明(设计)人: | 范昂 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汇泽知识产权代理有限公司 | 代理人: | 张颖玲 |
地址: | 100085*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 过滤 搜索引擎 查询 结果 方法 | ||
技术领域
本发明涉及一种搜索技术,尤其涉及一种过滤搜索引擎查询结果的方法。
背景技术
目前,用户通过互联网进行查询的过程通常为:首先,在搜索引擎中直接键入查询关键字,然后,在搜索引擎返回的众多查询结果中,选择用户当前所需要的查询结果。但是这种单一地依赖查询关键字来获取查询结果的方式,获得的查询结果不仅数量很大,而且往往搜索出很多用户并不需要的查询结果,不能很好地匹配用户当前的查询需要。
发明内容
有鉴于此,本发明的主要目的在于提供一种过滤搜索引擎查询结果的方法,对搜索引擎返回的查询结果进行了过滤和重新排序,用户能获得与当前查询需要相匹配的查询结果。
为达到上述目的,本发明的技术方案是这样实现的:
一种过滤搜索引擎查询结果的方法,该方法包括以下步骤:
A、用户端根据查询关键字发起查询请求;或用户端向搜索引擎发起查询请求;所述搜索引擎将从其网络端数据库中查询到的查询结果返回给所述用户端;
B、从所述用户端的当前操作窗口中提取数据信息后,通过在所述查询关键字与所述数据信息之间建立的关联,具体为:在所述查询关键字与所述数据信息之间建立关联,并将与所述查询关键字相关联的所述数据信息确定为用户当前的查询需要;计算所述搜索引擎返回的查询结果与所述当前查询需要之间的相似匹配程度,根据该相似匹配程度,对所述搜索引擎返回的查询结果进行 过滤和重新排序。
其中,所述用户端向搜索引擎发起查询请求具体为:
在用户端设置有搜索代理单元,搜索代理单元设定不同的搜索引擎,用户端通过所述搜索代理单元,向一个或一个以上搜索引擎发起查询请求。
其中,在用户端设置有搜索代理单元,步骤A进一步为:或用户端向所述搜索代理单元发起查询请求;
相应的,或步骤B具体为:在所述查询关键字与所述数据信息之间建立关联,并将其他从用户当前操作窗口数据信息中提取的关键信息确定为附加信息,将相关联的所述查询关键字与所述数据信息以及所述附加信息相结合,设置为查询条件;根据所述查询条件,所述用户端向所述搜索引擎发起查询请求;所述搜索引擎将查询结果返回所述用户端,完成用户查询。
其中,在所述查询关键字与所述数据信息之间建立关联进一步为:计算所述搜索引擎返回的查询结果与提取的所述数据信息之间的相似匹配程度;对所述数据信息进行聚类处理。
其中,所述聚类处理具体包括以下步骤:
X1、对当前操作窗口分类,提取所述操作窗口中的主题数据信息,获得对应各类操作窗口主题数据信息的向量特征;
X2、计算所述主题数据信息与所述搜索引擎返回的查询结果的相似匹配程度并聚类;
X3、对聚类得到的每类主题数据信息进行所述向量特征的合并,提取出这一类主题数据信息的特征向量。
其中,步骤X1中提取所述操作窗口中的主题数据信息具体采用的算法为:tf×IDF;其中,tf为所述主题数据信息在所述当前操作窗口出现的频率,以统 计方式获得的通用参数IDF为倒排文献频率。
其中,步骤X2中所述计算相似匹配程度采用基于向量空间模型VSM的VSM算法,VSM算法具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710118084.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:试剂管插放架及用于装运试剂管插放架的集装盒
- 下一篇:一种低功耗待机电源电路