[发明专利]通过替换概念性词语进行搜索推荐的系统有效
申请号: | 201310501114.X | 申请日: | 2013-10-22 |
公开(公告)号: | CN103593410B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 朱其立;孙伟 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 替换 概念性 词语 进行 搜索 推荐 系统 | ||
1.一种通过替换概念性词语进行搜索推荐系统,其特征在于,包括离线系统和在线系统,其中:
离线系统,用于解析识别搜索引擎日志中每条历史记录中包含的实体性关键词,然后按照这些实体性关键词所属的类别,为这些历史记录建立索引,以供在线系统使用;
在线系统,用于接收并解析由用户提交的搜索引擎查询,识别其中的概念性关键词,然后根据权重,寻找与给定搜索查询最为接近的、并且包含概念性关键词意义的实体性关键词的历史查询,然后将搜索到的查询进行排序,并返回给用户一个经过排序后的推荐列表,由用户选择其认为更为贴近的查询,进行二次查询。
2.根据权利要求1所述的通过替换概念性词语进行搜索推荐系统,其特征在于,所述离线模块包括实体抽象化模块和概念聚合模块,其中:
实体抽象化模块,用于识别每条历史查询中包含的实体性关键词,再将识别到的实体性关键词抽象化到对应的概念性关键词,然后交给概念聚合模块处理;
概念聚合模块,用于将包含相同概念的历史查询聚合到一起,建立索引;对于每一条历史查询,实体抽象化模块识别出其中包含的实体性关键词、以及它们对应的概念,概念聚合模块根据这些概念,将包含相同概念的历史查询聚合到一起;建立一个以概念为主键的索引,交给在线系统使用。
3.根据权利要求1所述的通过替换概念性词语进行搜索推荐系统,其特征在于,所述在线系统包括概念分析模块、索引检索模块和打分排序模块,其中:
概念分析模块,用于识别用户提交的搜索查询中的概念性关键词;
索引检索模块,用于根据概念分析模块识别出的概念性关键词,遍历由离线系统生成的索引,找到所有包含与识别出的概念性关键词相一致的实体性关键词的历史查询,将这些历史查询作为候选推荐查询;
打分排序模块,用于给所有索引检索模块找到的候选推荐查询打分,并且排序,最后将排好序的候选推荐列表的一部分返回给用户选择。
4.根据权利要求3所述的通过替换概念性词语进行搜索推荐系统,其特征在于,所述打分被定义为距离,其包含三个部分:语义距离、字面距离以及历史查询的质量。
5.根据权利要求4所述的通过替换概念性词语进行搜索推荐系统,其特征在于,所述语义距离是用来描述用户查询原有的概念性关键词与替换的实体性关键词的典型性的,典型性用如下公式定义:
其中,Typicality(instance,concept)表示对于给定概念,一个实体对于这个概念的典型程度,Freq(instance,concept)表示一个实体与一个概念共同出现的频率,Freq(concept)表示给定概念在语料库中的频率,instance表示一个实体,concept表示一个概念;
并用如下公式做变换:
其中,SemDist(typ)表示语义距离,typ表示一个典型度的值,由Typicality(instance,concept)公式计算出,e为自然底数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310501114.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据库资源回收方法及系统
- 下一篇:一种交友搜索解决方案