[发明专利]基于搜索词进行搜索推荐的方法、装置和搜索引擎在审
申请号: | 201510990198.7 | 申请日: | 2015-12-24 |
公开(公告)号: | CN106919577A | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 龚颖坤;项碧波;董毅 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市立方律师事务所11330 | 代理人: | 张筱宁 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 搜索词 进行 搜索 推荐 方法 装置 搜索引擎 | ||
技术领域
本发明涉及互联网技术领域,特别是涉及一种基于搜索词进行搜索推荐的方法、装置和搜索引擎。
背景技术
随着Web技术的不断发展,互联网信息的创建和分享变得越来越容易,信息的极度爆炸使得人们对于需要的信息的寻找变得越来越难,搜索推荐技术应运而生,搜索推荐技术的意义在于引导用户更快更准确的找到所需要的信息和资讯。
现有搜索推荐描述,一般都以“相关xx”其中xx为一些没有信息量的类别,如“人物”、“影片”等等,而且不同的类别的推荐结果都混合在一起;例如,在现有搜索引擎中搜索“变形金刚”,搜索引擎将出现推荐“相关人物”,其中既有电影演员,又有漫画角色,各维度的推荐结果混杂在一起,使得用户难以区分和查找,用户体验较差。
不仅如此,现有搜索推荐多基于Collaborative Filtering或Association Rules,特点是结果数量较少,且不够专注,导致推荐结果和用户意图不符。例如在现有搜索引擎中搜索“九寨沟”,搜索引擎将出现“相关景点”推荐,基本都是和“九寨沟”关系不大的一些全国热门景点,这样的搜索推荐方案不符合用户的搜索需求,对用户来说几乎没有意义。
发明内容
鉴于上述问题,提出了本发明,提供一种克服上述问题或者至少部分地解决上述问题的移动终端搜索图片的一种基于搜索词进行搜索推荐的方法、装置和搜索引擎。
本发明提供了一种基于搜索词进行搜索推荐的方法,包括:
获取多个候选推荐对象;
获取每两个候选推荐对象之间的相似度;
根据所述相似度对所述多个候选推荐对象进行分类以生成多个聚类;
接收用户输入的搜索词,并从所述多个聚类中获取与所述搜索词相关的候选推荐对象作为推荐结果。
可选的,所述根据所述相似度对所述多个候选推荐对象进行分类以生成多个聚类,包括:
通过层次聚类算法根据每两个候选推荐对象之间的相似度对所述多个候选推荐对象进行分类,直至生成的聚类的数量达到预设数量阈值或者生成的聚类之间的相似度达到预设相似度阈值。
可选的,还包括,对所述多个聚类进行排序。
可选的,通过以下公式获取每两个候选推荐对象之间的相似度:
其中,A和B分别表示两个候选推荐对象的主题模型向量,n为向量维数,Ai表示向量A在第i维度上的值,Bi表示向量B在第i维度上的值,i为大于等于1且小于等于n的整数。
可选的,所述接收用户输入的搜索词之后,还包括:
对所述搜索词进行分析,所述分析包括问题类型分析,所述问题类型分析用于判断所述搜索词是否属于适合为用户推荐对象的搜索词;
在所述搜索词属于适合为用户推荐对象的搜索词时,从所述多个聚类中获取与所述搜索词相关的候选推荐对象作为推荐结果。
可选的,还包括,对所述推荐结果进行过滤,过滤掉歧义的和属于垃圾内容的推荐结果。
可选的,根据知识图谱,为每个聚类选择一个恰当的描述作为聚类的名称。
可选的,所述从所述多个聚类中获取与所述搜索词相关的候选推荐对象作为推荐结果,包括:
根据随机游走算法在所述多个聚类中进行随机游走,选取出与所述搜索词最相关的预定数量的推荐结果。
可选的,还包括,将所述推荐结果嵌入搜索结果页面中输出。
本发明还提供了一种基于搜索词进行搜索推荐的装置,包括:
候选推荐对象获取模块,用于获取多个候选推荐对象;
相似度获取模块,用于获取每两个候选推荐对象之间的相似度;
聚类模块,用于根据所述相似度对所述多个候选推荐对象进行分类以生成多个聚类;
搜索词接收模块,用于接收用户输入的搜索词;
提取模块,用于从所述多个聚类中获取与所述搜索词相关的候选推荐对象作为推荐结果。
可选的,所述聚类模块,还用于:
通过层次聚类算法根据每两个候选推荐对象之间的相似度对所述多个候选推荐对象进行分类,直至生成的聚类的数量达到预设数量阈值或者生成的聚类之间的相似度达到预设相似度阈值。
可选的,所述聚类模块,还用于:对所述多个聚类进行排序。
可选的,所述相似度获取模块还用于:通过以下公式获取每两个候选推荐对象之间的相似度:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510990198.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大功率LED球泡灯
- 下一篇:一种可自动化生产的LED球泡灯