[发明专利]通过替换概念性词语进行搜索推荐的系统有效
申请号: | 201310501114.X | 申请日: | 2013-10-22 |
公开(公告)号: | CN103593410B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 朱其立;孙伟 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的通过替换概念性词语进行搜索推荐的系统,包括离线系统和在线系统;离线系统用于解析识别搜索引擎日志中每条历史记录中包含的实体性关键词,然后按照这些实体性关键词所属的类别,为这些历史记录建立索引;在线系统用于接收并解析由用户提交的搜索引擎查询,识别其中的概念性关键词,然后根据权重,寻找与给定搜索查询最为接近的、并且包含概念性关键词意义的实体性关键词的历史查询,然后将搜索到的查询进行排序,并返回给用户以进行二次查询。本发明简单直接、并且利用了源自搜索引擎的海量数据;在用户无法给出准确搜索词时,可以是用一些抽象的概念性关键词作;直接给出推荐的搜索词,提升了用户体验。 | ||
搜索关键词: | 通过 替换 概念性 词语 进行 搜索 推荐 系统 | ||
【主权项】:
一种通过替换概念性词语进行搜索推荐的系统,其特征在于,包括离线系统和在线系统,其中:离线系统,用于解析识别搜索引擎日志中每条历史记录中包含的实体性关键词,然后按照这些实体性关键词所属的类别,为这些历史记录建立索引,以供在线系统使用;在线系统,用于接收并解析由用户提交的搜索引擎查询,识别其中的概念性关键词,然后根据权重,寻找与给定搜索查询最为接近的、并且包含概念性关键词意义的实体性关键词的历史查询,然后将搜索到的查询进行排序,并返回给用户一个经过排序后的推荐列表,由用户选择其认为更为贴近的查询,进行二次查询;所述在线系统包括概念分析模块、索引检索模块和打分排序模块,其中:概念分析模块,用于识别用户提交的搜索查询中的概念性关键词;索引检索模块,用于根据概念分析模块识别出的概念性关键词,遍历由离线系统生成的索引,找到所有包含与识别出的概念性关键词相一致的实体性关键词的历史查询,将这些历史查询作为候选推荐查询;打分排序模块,用于给所有索引检索模块找到的候选推荐查询打分,并且排序,最后将排好序的候选推荐列表的一部分返回给用户选择;所述打分被定义为距离,其包含三个部分:语义距离、字面距离以及历史查询的质量;所述语义距离是用来描述用户查询原有的概念性关键词与替换的实体性关键词的典型性的,典型性用如下公式定义:其中,Typicality(instance,concept)表示对于给定概念,一个实体对于这个概念的典型程度,Freq(instance,concept)表示一个实体与一个概念共同出现的频率,Freq(concept)表示给定概念在语料库中的频率,instance表示一个实体,concept表示一个概念;并用如下公式做变换:其中,SemDist(typ)表示语义距离,typ表示一个典型度的值,由 Typicality(instance,concept)公式计算出,e为自然底数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310501114.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据库资源回收方法及系统
- 下一篇:一种交友搜索解决方案