[发明专利]一种搜索的方法、系统和装置有效
申请号: | 200810190595.6 | 申请日: | 2008-12-24 |
公开(公告)号: | CN101685456A | 公开(公告)日: | 2010-03-31 |
发明(设计)人: | 胡汉强 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 方法 系统 装置 | ||
技术领域
本发明涉及通信技术领域,尤其是一种搜索的方法、系统与装置。
背景技术
随着科学的发展和进步,通信技术也随着飞速发展,其中移动搜索的也 是一个在伴随着通信技术发展的新亮点。移动搜索技术的研究也成为业界研 发的重点。移动搜索其中一个很重要的技术亮点是精确搜索,也就是提供给 用户个性化的搜索服务,实现用户所搜即所得。
现有技术一种元搜索个性化的处理方案中,搜索服务器搜集成员引擎的 元索引,搜索服务器根据元索引计算搜索请求与成员引擎的相似度,选择相 似度高的成员引擎为用户服务,将搜索请求分发给这些选中的成员引擎进行 搜索。
发明人在实现本发明的过程中,发现该元搜索方案中选中的成员引擎可 能不准确,导致搜索的精确度不高。
发明内容
为了提高搜索的精确度,本发明的实施方式提供了相应的用于搜索的方 法、系统和装置。
一种搜索的方法,该方法包括根据各个成员引擎的元索引、搜索请求和 所述用户的个性化数据选择成员引擎,以便于所述选择的成员引擎完成搜 索,所述元索引所述元索引包括下述信息之一或者其任意组合:
术语最大归一化权重向量mnw=(mnw1,mnw2,...,mnwi,...mnwp),其 中mnwi为术语ti相对于所述成员引擎对应的数据库或者子数据库中的所有 文档的最大归一化权重;
术语平均归一化权重向量anw=(anw1,anw2,...,anwi......,anwp), 其中anwi为术语ti相对于所述成员引擎对应的数据库或者子数据库中的所 有文档的平均归一化权重;
数据库或者子数据库中的文档的兴趣模型最大归一化权重向量 mnv=(mnv1,mnv2,......,mnvi,......,mnvn),其中mnvi为所述文档的 兴趣模型的第i个维度相对于所述成员引擎对应的数据库或者子数据库中的 所有文档的最大归一化权重;
数据库或者子数据库中的文档的兴趣模型平均归一化权重向量anv =(anv1,anv2,......,anvi,......,anvn),其中anvi为文档的兴趣模型的 第i个维度相对于所述成员引擎对应的数据库或者子数据库中的所有文档的 平均归一化权重;
术语ti相对于该数据库的全局反向文档频率gidfi,其中gidfi=1/dfi,dfi 为该元索引对应的数据库中包含术语ti的文档的数量;
文档的兴趣模型第i个维度对应的全局反向文档频率IM_gidfi,其中 IM_gidfi=1/IM_IDFi,IM_IDFi为数据库或者子数据库中包含的属于文档的 兴趣模型的第i个维度的术语的文档的个数;
术语ti相对于该数据库的全局反向文档频率gidfi=log(n/(gdfi+1)),其中 gdfi为所有成员引擎对应数据库或者子数据库中包含术语ti的文档的数量的 总和,n为所有成员引擎所包含的所有文档数量的总和;或者,
文档的兴趣模型第i个维度对应的全局反向文档频率 IM_gidfi=log(n/(IM_gdfi+1)),IM_gdfi为所有成员引擎对应的数据库或子数 据库中包含属于文档的兴趣模型的第i个维度的术语的文档个数的总和,n 为所有成员引擎所包含的所有文档数量的总和。
相应的,一种用于搜索的系统,该系统能够应用上述搜索方法,该系统 包括搜索客户端,用于向搜索服务子系统发送搜索请求;搜索服务子系统, 用于接收搜索客户端发送的搜索请求,接收各个成员引擎上报的元索引,根 据所述各个成员引擎的元索引、所述搜索请求和用户的个性化数据选择成员 引擎,将所述搜索请求发送给所述选择的成员引擎;至少一个成员引擎,用 于向搜索服务子系统上报该成员引擎的元索引,并在接收到所述搜索服务子 系统发送的搜索请求后,完成搜索;所述元索引包括下述信息之一或者其任 意组合:
术语最大归一化权重向量mnw=(mnw1,mnw2,...,mnwi,...mnwp),其 中mnwi为术语ti相对于所述成员引擎对应的数据库或者子数据库中的所有 文档的最大归一化权重;
术语平均归一化权重向量anw=(anw1,anw2,...,anwi......,anwp), 其中anwi为术语ti相对于所述成员引擎对应的数据库或者子数据库中的所 有文档的平均归一化权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810190595.6/2.html,转载请声明来源钻瓜专利网。