[发明专利]一种基于主题的搜索优化方法有效
申请号: | 201711178366.8 | 申请日: | 2017-11-23 |
公开(公告)号: | CN107784123B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 黄浩 | 申请(专利权)人: | 北京中科智营科技发展有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京天方智力知识产权代理事务所(普通合伙) 11719 | 代理人: | 谷成 |
地址: | 100029 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主题 搜索 优化 方法 | ||
本发明公开了一种基于主题的搜索优化方法,该搜索优化方法包括如下步骤:步骤1,获取用户提供的数据集,所述数据集中包含用户所属领域的词汇;步骤2,利用所述词汇生成主题,主题中包含预设关键词及词间逻辑关系;步骤3,读取用户向搜索引擎输入的目标关键词,将所述目标关键词与所述预设关键词进行匹配,根据所述词间逻辑关系向用户展示搜索结果。本发明提供了一种符合用户需求的搜索方法,不仅能有效地提高搜索的准确性和智能性,而且能对搜索结果进行优化,高效率地为用户提供精准的搜索结果。
技术领域
本发明涉及全文搜索引擎技术领域,更为具体来说,本发明为一种基于主题的搜索优化方法。
背景技术
目前,传统的全文搜索引擎通过索引扫描全文中的每一个词,然后对每个词进行索引,指明每个词在文章中出现的次数和位置;用户进行搜索操作时,全文搜索引擎根据建立好的索引进行查找,将查找的结果反馈给用户。但是,随着知识库的扩大和用户知识水平的不断提高,这种类似于“通过字典中的检索子表查字”的方式已经无法满足用户的需求。
上述传统的搜索方法存在如下问题:(1)搜索结果往往与用户的意图不相关;(2)有用的搜索结果排序过于靠后。比如,当用户输入“阿里云安全”时,显示的搜索结果往往是“阿里云”、“网络安全”等等类似的结果,对相关领域的技术人员来说,很显然,这并不是用户需要的结果。
因此,如何使搜索结果符合用户意图、将有用的搜索结果优先展示给用户,成为了本领域技术人员亟待解决的技术问题和始终研究的重点。
发明内容
为解决传统的全文搜索引擎提供的搜索结果与用户的意图相差过大、有用的搜索结果排序过于靠后等问题,本发明创新提出了一种基于主题的搜索优化方法,从而解决现有技术中存在的搜索不智能、不准确、难优化等问题,有效提高了全文搜索的智能性和分类的准确性。
为实现上述技术目的,本发明公开了一种基于主题的搜索优化方法,所述搜索优化方法包括如下步骤:
步骤1,获取用户提供的数据集,所述数据集中包含用户所属领域的词汇;
步骤2,利用所述词汇生成主题,所述主题中包含预设关键词及词间逻辑关系;
步骤3,读取用户向搜索引擎输入的目标关键词,将所述目标关键词与所述预设关键词进行匹配,根据所述词间逻辑关系向用户展示搜索结果。
本发明不仅能够解决传统的全文搜索引擎存在的搜索结果与用户的意图相差过大、有用的搜索结果排序过于靠后等问题,而且能够满足用户定制化的需求,使搜索结果极大地符合用户需要,且搜索效率非常高。
进一步地,步骤2中,所述词间逻辑关系包括词间关联关系,并为相关联的预设关键词赋予凸显标记;
步骤3中,将与目标关键词成功匹配、且被赋予凸显标记的相关联的预设关键词所在的搜索结果优先展示。
基于上述改进的技术方案,本发明能针对用户输入的具有关联关系的多个目标关键词进行更为高效的展示,提高用户搜索的精准度。
进一步地,步骤2中,按照凸显标记由大到小的顺序,所述词间关联关系包括下述关系中的至少一种:多个预设关键词间紧邻且顺序出现、多个预设关键词间相隔字符小于N个、多个预设关键词在一个自然句中出现、多个预设关键词在一个段落中出现、多个预设关键词在一个文章中出现;
步骤3中,如果存在与目标关键词成功匹配且具有不同的凸显标记的多个预设关键词,则按照凸显标记由大到小的顺序依次展示搜索结果。
基于上述改进的技术方案,如果用户输入的多个目标关键词之间同时存在至少两种此间关联关系,本发明能实现将更符合用户意图的搜索结果优先展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科智营科技发展有限公司,未经北京中科智营科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711178366.8/2.html,转载请声明来源钻瓜专利网。