[发明专利]搜索需求分析方法和装置有效
申请号: | 201410687222.5 | 申请日: | 2014-11-25 |
公开(公告)号: | CN104462272B | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 付志宏;周古月;贺旭;何径舟;石磊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 需求 分析 方法 装置 | ||
技术领域
本发明涉及搜索技术领域,特别涉及一种搜索需求分析方法和装置。
背景技术
传统的关键词匹配搜索引擎,由于只是对搜索词query进行分词,利用得到的关键词到索引数据中进行检索,并不真正完全理解用户的检索意图,导致检索出的结果仅是包含搜索词中的关键词的结果,并不一定能够满足用户的检索需求。例如Query“刘德华的图片”,在传统的搜索引擎中将分别用“刘德华”和“图片”两个关键词在索引数据中进行检索,检索结果只是包含关键词“刘德华”或者包含关键词“图片”的数据,而非用户真正想获得的“刘德华图片”的数据资源。
因此可进行搜索需求分析的搜索引擎,在现代搜索引擎中扮演着越来越重要的作用。搜索需求分析即分析搜索词的结构与成分,从语义上理解搜索词的检索需求,从而识别出用户的检索意图,从语义上理解query的检索需求,除了能够提供更精准的检索结果之外,还能够针对用户的检索需求,提供更灵活的产品形态。例如Query“刘德华的图片”进行需求识别之后,可以直接提供用户需要的刘德华图片资源。
搜索需求分析目前大多采用模板匹配或者利用Query的检索结果训练机器学习模型的方法。其中模板匹配虽然准确率很高,但是检索结果不够全面,召回率很低,并且模板挖掘依赖于大量人力工作,需要针对每一类需求进行模板挖掘,工作量大,而且语种之间无法迁移;而利用Query检索结果训练机器学习模型的方法完全依赖于检索结果的准确性,准确率很难获得保证,从而导致根据训练的及其学习模型进行搜索得到的结果的准确率也无法保证。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种搜索需求分析方法,在提高了搜索的准确率的同时,还提高了搜索的召回率,可方便地在多个不同语种之间进行迁移,更加方便。
本发明的第二个目的在于提出一种搜索需求分析装置。
为达上述目的,根据本发明第一方面实施例提出了一种搜索需求分析方法,包括以下步骤:获取搜索词,并获取所述搜索词对应的多个关联词;抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特征;以及根据所述原始特征和所述关联特征获取搜索需求。
本发明实施例的搜索需求分析方法,通过获取搜索词对应的多个关联词,并分别抽取搜索词的特征和多个关联词的特征,根据搜索词的特征和关联词的特征获取搜索需求,能够准确地获取用户的搜索需求,从而搜索引擎根据用户的搜索需求提供更符合用户需要的搜索结果,进而在提高了搜索的准确率的同时,还提高了搜索的召回率。此外,搜索需求的分析过程与语言无关,因此可方便地在多个不同语种之间进行迁移,更加方便。
本发明第二方面实施例提供了一种搜索需求分析装置,包括:第一获取模块,用于获取搜索词,并获取所述搜索词对应的多个关联词;抽取模块,用于抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特征;以及第二获取模块,用于根据所述原始特征和所述关联特征获取搜索需求。
本发明实施例的搜索需求分析装置,通过获取搜索词对应的多个关联词,并分别抽取搜索词的特征和多个关联词的特征,根据搜索词的特征和关联词的特征获取搜索需求,能够准确地获取用户的搜索需求,从而搜索引擎根据用户的搜索需求提供更符合用户需要的搜索结果,进而在提高了搜索的准确率的同时,还提高了搜索的召回率。此外,搜索需求的分析过程与语言无关,因此可方便地在多个不同语种之间进行迁移,更加方便。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的搜索需求分析方法的流程图;
图2为根据本发明一个实施例的抽取搜索词的特征并作为原始特征的流程图;
图3a为根据本发明实施例的中文的搜索结果示意图;
图3b为根据本发明实施例的葡萄牙语的搜索结果示意图;
图3c为根据本发明实施例的阿拉伯语的搜索结果示意图;
图4为根据本发明一个实施例的搜索需求分析装置的结构示意图;
图5为根据本发明一个具体实施例的搜索需求分析装置的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410687222.5/2.html,转载请声明来源钻瓜专利网。