[发明专利]一种搜索方法、装置、存储介质及电子设备有效
申请号: | 202111113411.8 | 申请日: | 2021-09-23 |
公开(公告)号: | CN113886685B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 袁泽宇;张鑫慧;战鹏弘 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06F40/289 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 方法 装置 存储 介质 电子设备 | ||
本说明书公开了一种搜索方法、装置、存储介质及电子设备。在本说明书提供的搜索方法中,获取每个搜索结果与搜索内容原始的匹配度。确定了与搜索内容对应的预设的搜索特征,并根据搜索特征与搜索结果的热度得确定了每个搜索特征对每个搜索结果的调整权重。根据调整权重对每个搜索结果与搜索内容的匹配度进行调整,并使用调整后的匹配度得到更加合理的排序结果。从上述方法中可以看出,在确定了各搜索结果与搜索内容的匹配度之外,本方法还在对搜索结果排序的过程中加入搜索特征,并根据搜索特征对匹配度进行优化调整,最终得到一个更加合理,更能满足用户需求的搜索结果排序。
技术领域
本说明书涉及互联网应用技术领域,尤其涉及一种搜索方法、装置、存储介质及电子设备。
背景技术
如今,生活中各方面的数据都随着互联网的发展而膨胀,这使每天出现在互联网上的信息量变得巨大。目前,使用搜索引擎已成为人们最常用的获取信息的手段,但人们在使用搜索引擎时,往往只会关注搜索结果的前几条,而过于庞大的信息量经常会导致搜索引擎将用户真正想要的信息排在很靠后的位置,用户可能会花费大量的时间来寻找自己想要的信息。
在现有技术中,搜索引擎采用的最佳匹配25(Best Match 25,BM25)算法是一种只根据搜索文本相似度对搜索结果进行排序的算法,这种算法排序后得到的结果往往并不是用户真正需要的结果。如果出现了多个关键词相同的词条,BM25算法也只会根据关键词在词条文档内容中的词频对搜索结果进行排序。
在实际搜索时,搜索引擎根据BM25算法返回的结果很可能会将用户真正想要的信息排在很靠后的位置。也就是说,目前的搜索引擎采用的算法不能对搜索结果进行智能排序,将用户想要的结果呈现在靠前的位置。
发明内容
本说明书提供一种搜索方法、装置及计算机存储介质和无人设备,用于解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种搜索方法,包括:
获取用户输入的搜索内容;
根据所述搜索内容查询搜索结果,并确定每个搜索结果与所述搜索内容的匹配度;
确定当前的环境信息,根据所述搜索内容以及所述环境信息,确定与所述搜索内容和所述环境信息相关的搜索特征;
针对每个搜索结果,根据所述搜索特征,确定该搜索结果相对于所述搜索特征的调整权重;
采用所述调整权重调整该搜索结果与所述搜索内容的匹配度;
根据调整后的各搜索结果与所述搜索内容的匹配度,对各搜索结果进行排序,并向用户返回排序后的各搜索结果。
可选的,所述搜索内容包括:文本;
所述当前的环境信息包括:用户输入所述搜索内容时的时间和/或地理位置;
根据所述搜索内容以及所述环境信息,确定与所述搜索内容和所述环境信息相关的搜索特征,具体包括:
对所述搜索内容进行分词,得到所述搜索内容中包含的各关键词;
根据预设的各搜索特征与关键词的对应关系、各搜索特征与环境信息的对应关系,在预设的各搜索特征中,确定与所述用户输入的搜索内容中包含的关键词以及所述当前的环境信息对应的搜索特征。
可选的,根据所述搜索特征,确定该搜索结果相对于所述搜索特征的调整权重,具体包括:
针对每个搜索特征,确定当前该搜索特征的特征权重;
根据该搜索特征的特征权重,确定该搜索特征与该搜索结果的相关性表征值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111113411.8/2.html,转载请声明来源钻瓜专利网。