[发明专利]优化搜索结果的方法及装置有效
申请号: | 201611069038.X | 申请日: | 2016-11-29 |
公开(公告)号: | CN106649606B | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 吴小山;韦思宁;赵倬;唐朝辉 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨贝贝;刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 优化 搜索 结果 方法 装置 | ||
1.一种优化搜索结果的方法,应用于对搜索系统进行分析的搜索分析系统,所述搜索系统提供不同的索引字段,其特征在于,所述方法包括:
获取所述搜索系统的搜索日志,所述搜索日志中包括发生过的搜索中的搜索词信息、搜索结果信息及用户的操作信息;
从所述搜索词信息中确定出用于测试的搜索词集合,并根据所述搜索词信息、搜索结果信息及用户的操作信息对所述搜索词集合中每个搜索词的搜索进行有效性分析,得到关于有效性的分析结果;
以所述搜索词集合中的搜索词在索引字段的不同权重集下进行测试搜索,得到各搜索词在所述不同权重集下的测试结果;所述权重集是由各索引字段的权重值组合而成集合;
利用从所述搜索日志得到的关于有效性的分析结果测算每个权重集下的测试结果的有效值;
确定各所述测试结果的有效值中满足预设条件的有效值,将满足所述预设条件的有效值对应的权重集作为所述索引字段的最优权重集;
以所述最优权重集对所述搜索系统中的索引字段的权重值进行更新;
其中,所述有效性分析包括:对所述每个搜索词所产生的搜索结果中的文档的有效性进行分析;相应的,所述得到关于有效性的分析结果包括:得到每个搜索词的有效文档集以及所述有效文档集中每个有效文档的有效值;
所述利用从所述搜索日志得到的关于有效性的分析结果测算每个权重集下的测试结果的有效值,具体包括:
从各权重集的测试结果中提取用于进行测算的测算文档集;
确定测试搜索中搜索到所述测算文档集的搜索词,从所述测算文档集中识别出包括在所述测算文档集对应的搜索词的有效文档集中的测算文档;
从所述关于有效性的分析结果中获取识别出的测算文档的有效值;
根据每个权重集下识别出的测算文档的有效值计算所述权重集下的测试结果的有效值。
2.根据权利要求1所述的方法,其特征在于,所述以所述搜索词集合中的搜索词在索引字段的不同权重集下进行测试搜索包括:
通过调整所述索引字段的权重值来得到所述索引字段的不同权重集;
在每次调整后,以所述搜索词集合中的搜索词在调整后的权重集下进行测试搜索,得到不同权重集下的测试结果。
3.根据权利要求1所述的方法,其特征在于,所述对所述每个搜索词所产生的搜索结果中的文档的有效性进行分析,包括:
确定所述每个搜索词的有效文档集;
根据公式Rix=r*Di*Fi2确定所述有效文档集中第x个有效文档相对第i个搜索词的有效值,其中,r为预设的参数,Di为所述第x个有效文档被所述用户选中的次数,Fi为所述用户选中所述第x个有效文档之前的翻页次数。
4.根据权利要求3所述的方法,其特征在于,所述根据每个权重集下识别出的测算文档的有效值计算所述权重集下的测试结果的有效值,具体包括:
根据公式确定第i个搜索词对应的测算文档集相对所述第i个搜索词的测试搜索有效值,其中,z为所述测算文档集中测算文档的总个数,R′ix为所述测算文档集中第x个测算文档相对第i个搜索词的测试搜索有效值,当所述第x个测算文档为所述识别出的测算文档时,R′ix=Rix,当所述第x个测算文档不是所述识别出的测算文档时,R′ix=0;
根据公式确定第x个权重集下的测试结果的有效值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611069038.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:桌凳套件
- 下一篇:基于矢量掩膜的遥感图像在线目标识别与监测方法及系统