[发明专利]一种相关搜索系统、方法及装置有效
申请号: | 201210018974.3 | 申请日: | 2012-01-20 |
公开(公告)号: | CN103218373B | 公开(公告)日: | 2018-02-06 |
发明(设计)人: | 高小平;宋国龙 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相关 搜索 系统 方法 装置 | ||
技术领域
本发明涉及搜索引擎技术,特别涉及一种相关搜索系统、方法及装置。
背景技术
随着互联网的发展,通过互联网网络侧可以为客户端提供各种服务。其中一种就是搜索服务,也就是在网络侧设置搜索引擎,当网络侧的搜索引擎接收客户端发送的搜索请求后,检索互联网网络侧候选数据库中所存储的匹配该搜索请求携带的关键词的所有字面索引,提供给客户端。为了提高使用客户端的用户搜索体验度,提出了相关搜索技术,也就是网络侧的搜索引擎在接收搜索请求后,不仅仅检索互联网网络侧候选数据库中匹配该搜索请求携带的关键词的所有字面索引,还检索互联网网络侧候选数据库所存储的匹配该搜索请求携带的关键词的相关或相近字面索引,提供给客户端,用于用户的进一步搜索。
图1为现有技术互联网网络侧提供的搜索服务示意图,包括客户端、网络侧提供的搜索引擎及网络侧提供的候选数据库,其中,
客户端,用于向搜索引擎发送搜索请求,该搜索请求携带关键词,接收搜索引擎返回的搜索结果;
搜索引擎,用于接收搜索请求,到候选数据库中查找匹配该请求所携带关键词的相关或相同字面索引,得到搜索结果,返回给客户端;
候选数据库,用于对应关键词存储相同或相关字面索引。
具体地,图2为现有技术搜索引擎的结构示意图,包括:查询解析模块、检索模块及字面相关度计算模块,其中,
查询解析模块,用于从所接收到的搜索请求中,进行查询解析,得到所携带的关键词;
查询模块,用于到候选数据库中查找匹配该请求所携带关键词的所有相关或相同字面索引;
字面相关度计算模块,用于分别计算所查找到的所有相关或相同字面索引与关键词的字面相似度,将所设定数量的字面相似度最高的相关或相同字面索引反馈给客户端。
从上述方案可以看出,目前只是采用单一的候选数据库进行搜索请求携带的关键词的相关或相同字面索引匹配,且采用字面相关度计算得到字面相似度最高的设定数量的相关或相同字面结果反馈给客户端。这样,只能得到搜索请求所携带的与关键词匹配的相关或相同字面结果,而无法得到相关或相同语义结果,这会降低用户的体验度。
发明内容
有鉴于此,本发明提供一种相关搜索方法,能够提高搜索的准确度。
本发明还提供一种相关搜索装置,能够提高搜索的准确度。
本发明还提供一种相关搜索系统,能够提高搜索的准确度。
为达到上述目的,本发明的技术方案是这样实现的:
一种相关搜索方法,该方法包括:
接收携带关键词的搜索请求,解析搜索请求得到关键词;
在候选数据库中查找与关键词匹配的字面索引并根据字面相似度从匹配的字面索引中计算得到字面搜索结果,在语义相关性数据库查找与关键词匹配的语义索引得到语义搜索结果;
将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果。
该方法还包括:
在设置的快速更新数据库查找与关键词匹配的更新字面索引,根据字面相似度从匹配的更新字面索引中计算得到更新字面搜索结果,在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
所述解析搜索请求得到关键词具体为:
采用反文档频率idf方式从搜索请求解析得到关键词。
所述根据字面相似度从匹配的字面索引中计算得到字面搜索结果具体为:
采用关键词权重加权方式对匹配的字面索引进行计算,得到字面搜索结果。
一种相关搜索装置,包括:收发模块、解析模块、检索模块、字面相似度计算模块、语义相似度计算模块及融合模块,其中,
收发模块,用于接收携带关键词的搜索请求,发送从融合模块得到的最终匹配关键词的搜索结果;
解析模块,用于从搜索请求中解析关键词;
检索模块,用于在候选数据库中查找与关键词匹配的字面索引,在语义相关性数据库查找与关键词匹配的语义索引;
字面相似度计算模块,用于根据字面相似度从匹配的字面索引中计算得到字面搜索结果;
融合模块,用于将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果。
检索模块,还用于在快速更新数据库查找与关键词匹配的更新字面索引;
字面相似度计算模块,还用于根据字面相似度从匹配的更新字面索引中计算得到更新字面搜索结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210018974.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:弹力气囊式压迫带
- 下一篇:基于位置提供广告的方法和系统