[发明专利]一种搜索方法及装置有效
申请号: | 201210031523.3 | 申请日: | 2012-02-13 |
公开(公告)号: | CN103246681B | 公开(公告)日: | 2018-10-26 |
发明(设计)人: | 路彦雄;杨月奎;王亮;焦峰 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 刘杰 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 方法 装置 | ||
本发明实施例公开了一种搜索方法,包括:获取待搜索信息的所有关联文档;基于词匹配算法及语义匹配算法,计算每一个关联文档与所述待搜索信息的相关度;根据计算得到的相关度对所有关联文档进行排序处理,并显示排序结果。本发明实施例还公开了一种搜索装置。本发明综合考虑词与词的匹配,以及词与词之间的语义关系的匹配,获得准确的相关度计算结果,为用户提供理想的搜索结果,提高用户的满意度。
技术领域
本发明涉及计算机网络搜索技术领域,尤其涉及一种搜索方法及装置。
背景技术
目前,传统的搜索方案主要为:根据用户输入待搜索信息在网络中查找所有的关联文档,依据一定的算法规则计算每个关联文档与待搜索信息的关联程度,基于关联程度的高低对所有关联文档进行排序处理,将排序结果作为搜索结果返回给用户。上述可知,关联程度的高低直接影响关联文档的排序结果,直接影响用户的搜索结果,而关联程度的高低一般采用相关度评分直观反映。
传统的搜索方案中,通常采用词匹配算法进行相关度计算,例如采用BM25(BestMatch,最佳匹配)算法、proximity(Term proximity scoring,词近邻得分)算法等等进行相关度评分,相关度评分越高,表明关联程度越强。以基于BM25算法的搜索方案进行说明,如下:假设用户输入的待搜索信息为“中国的首都”,根据BM25算法的相关度评分原则,关联文档中必须出现“中国”、“首都”,才能够获得相应的相关度评分,否则该关联文档的相关度评分则为0;例如:其中一个关联文档为:“北京,它是一座有着3000多年的建城史,850多年的建者史的历史文化名城;是全国政治、文化中心,也是全国最大的陆空产通枢纽”,根据上述传统的搜索方案,该关联文档的相关度评分为0,表明与待搜索信息不相关,然而,从语义关系来看,该关联文档与待搜索信息的相关性实际上是十分好的。经过排序处理后,该关联文档可能排列于较后的搜索结果页面中,不利于用户的查看。上述例子可知,传统的搜索方案仅仅基于词进行相关度的匹配,并未考虑词与词之间的语义关系,可能造成相关度计算结果的不准确,影响搜索结果的排列顺序,降低用户对搜索结果的满意度,降低用户的搜索体验。
发明内容
本发明实施例所要解决的技术问题在于,提供一种搜索方法及装置,能够获得更准确的搜索结果。
一方面,本发明实施例提供了一种搜索方法,包括:
获取待搜索信息的关联文档;
基于词匹配算法及语义匹配算法,计算获取到的每一个关联文档与所述待搜索信息的相关度;
根据计算得到的相关度对获取到的关联文档进行排序,并显示排序结果。
另一方面,本发明实施例还提供了一种搜索装置,包括:
搜索模块,用于获取待搜索信息的关联文档;
计算模块,用于基于词匹配算法及语义匹配算法,计算所述搜索模块获得的每一个关联文档与所述待搜索信息的相关度;
排序模块,用于根据所述计算模块计算得到的相关度对所述搜索模块获得的所有关联文档进行排序处理;
显示模块,用于显示所述排序模块获得的排序结果。
实施本发明实施例,具有如下有益效果:
本发明实施例结合词匹配算法及语义匹配算法,综合考虑词与词的匹配,以及词与词之间的语义关系的匹配,获得每一个关联文档与待搜索信息之间较为准确的相关度,基于该相关度进行排序并显示排序结果,可以为用户提供理想的搜索结果,使得用户可以从显示的搜索结果中快速获得相关度较高的关联文档,满足自己实际的搜索需求,提高了搜索效率,从而提高了用户的满意度。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210031523.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能制动弹簧料盒
- 下一篇:化学机械抛光设备