[发明专利]一种相关搜索方法和装置有效
申请号: | 201510092270.4 | 申请日: | 2015-02-28 |
公开(公告)号: | CN104715022B | 公开(公告)日: | 2018-07-31 |
发明(设计)人: | 胡军;陈英傑;李伟 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 刘祥景 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相关 搜索 方法 装置 | ||
本发明实施例提供了一种相关搜索方法和装置,其中的方法具体包括:依据用户输入的搜索词查询索引表,以得到与所述搜索词对应的相关列表;其中,所述索引表中存储有搜索词与相关列表之间的映射关系,所述相关列表中记录有基于多种相关搜索词挖掘方法得到的相关搜索词与对应的分质量参数、以及基于日志统计得到的所述相关搜索词的相关特征之间的映射关系;依据所述相关列表中记录的相关搜索词及所述相关搜索词对应的分质量参数和相关特征,确定所述相关搜索词的总质量参数;对总质量参数最高的若干个相关搜索词进行展现。本发明实施例能够有效提高相关搜索结果的多样性以及覆盖率。
技术领域
本发明涉及搜索引擎技术领域,特别是涉及一种相关搜索方法和装置。
背景技术
随着互联网发展,信息的快速膨胀,人们对搜索引擎的依赖越来越大。但是在有些情况下,用户输入的搜索词不能准确地描述搜索意图,从而导致得到的搜索结果无法满足用户需求。为了提高用户搜索的体验度,相关搜索技术应运而生,相关搜索技术可以检索所述搜索词对应的相关搜索词,并提供给用户,以便于用户的二次检索。
传统的相关搜索方法具有相关搜索词多样性较差的缺点,或者具有对于长尾搜索词的搜索效果不佳的缺点,或者导致相关搜索覆盖率较低。
发明内容
本发明实施例所要解决的技术问题是提供一种相关搜索方法和装置,能够有效提高相关搜索结果的多样性以及覆盖率。
为了解决上述问题,本发明公开了一种相关搜索方法,包括:
依据用户输入的搜索词查询索引表,以得到与所述搜索词对应的相关列表;其中,所述索引表中存储有搜索词与相关列表之间的映射关系,所述相关列表中记录有基于多种相关搜索词挖掘方法得到的相关搜索词与对应的分质量参数、以及基于日志统计得到的所述相关搜索词的相关特征之间的映射关系;
依据所述相关列表中记录的相关搜索词及所述相关搜索词对应的分质量参数和相关特征,确定所述相关搜索词的总质量参数;
对总质量参数最高的若干个相关搜索词进行展现。
优选地,通过如下步骤生成所述相关列表:
采用多种相关搜索词挖掘方法挖掘得到搜索词对应的相关搜索词及所述相关搜索词在各种相关搜索词挖掘方法中对应的分质量参数;
对基于多种相关搜索词挖掘方法得到的相关搜索词及所述相关搜索词在各种相关搜索词挖掘方法中对应的分质量参数进行第一融合处理,得到所述相关搜索词及所述相关搜索词在多种相关搜索词挖掘方法中对应的分质量参数;
通过分析日志得到所述相关搜索词对应的相关特征;
对所述相关搜索词及所述相关搜索词在多种相关搜索词挖掘方法中对应的分质量参数、及所述相关搜索词对应的相关特征进行第二融合处理,得到所述相关搜索词与分质量参数和相关特征之间的映射关系,并将所述映射关系记录至相关列表。
优选地,所述相关搜索词的相关特征包括所述相关搜索词的点击率,所述相关搜索词对应的分质量参数包括:所述相关搜索词在多种相关搜索词挖掘方法中对应的分质量参数,则所述依据所述相关列表中记录的相关搜索词及所述相关搜索词对应的分质量参数和相关特征,确定所述相关搜索词的总质量参数的步骤,包括:
依据所述相关搜索词的点击率与点击权重的乘积确定点击参数;
对所述相关搜索词在多种相关搜索词挖掘方法中对应的分质量参数进行第一加权处理,得到相应的挖掘方法参数;
对所述点击参数和所述挖掘方法参数进行第二加权处理,得到所述相关搜索词的总质量参数。
优选地,所述相关搜索词的点击率为基于日志统计得到相关搜索词的被点击次数与被展现次数的比值。
优选地,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510092270.4/2.html,转载请声明来源钻瓜专利网。