[发明专利]搜索需求分析方法和装置有效
申请号: | 201410687222.5 | 申请日: | 2014-11-25 |
公开(公告)号: | CN104462272B | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 付志宏;周古月;贺旭;何径舟;石磊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 需求 分析 方法 装置 | ||
1.一种搜索需求分析方法,其特征在于,包括以下步骤:
获取搜索词,并获取所述搜索词对应的多个关联词;
抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特征;以及
根据所述原始特征和所述关联特征获取搜索需求;
其中,通过对所述关联词本身进行分析以抽取所述关联词的特征,所述抽取所述多个关联词的特征并作为关联特征,包括:
对所述关联词进行分词以抽取与所述搜索词相关且不包含所述搜索词的多个关键词;从所述多个关键词中选择与所述搜索词需求相关的特征词,并将所述特征词作为所述多个关联词的特征;或者,
通过对根据所述关联词获取的搜索结果或通过对用户点击日志进行分析以抽取所述关联词的特征,所述抽取所述多个关联词的特征并作为关联特征,包括:
获取所述多个关联词的多个搜索结果或用户点击日志;从所述多个关联词的多个搜索结果或用户点击日志中抽取所述关联词的Title特征、搜索特征和点击特征中的一种或多种,并将所述Title特征、搜索特征和点击特征中的一种或多种作为所述关联特征。
2.如权利要求1所述的搜索需求分析方法,其特征在于,所述根据所述原始特征和所述关联特征获取搜索需求具体包括:
根据所述原始特征和所述关联特征查询搜索需求识别模型以获取所述搜索需求。
3.如权利要求1所述的搜索需求分析方法,其特征在于,所述获取所述搜索词对应的多个关联词具体包括:
以所述搜索词为中心将与所述搜索词之间的编辑距离小于预设距离的词作为所述关联词;和/或
对所述搜索词进行语义分析,并将与所述搜索词语义近似的词作为所述关联词。
4.如权利要求1所述的搜索需求分析方法,其特征在于,所述抽取所述搜索词的特征并作为原始特征具体包括:
提取所述搜索词中的专名、专名类别以及各个成分的语义TAG标签信息;
提取所述搜索词的组成结构;
根据所述搜索词中的专名、所述专名类别、所述各个成分的语义TAG信息以及所述组成结构生成所述搜索词的描述模板,并将所述描述模板作为所述原始特征。
5.一种搜索需求分析装置,其特征在于,包括:
第一获取模块,用于获取搜索词,并获取所述搜索词对应的多个关联词;
抽取模块,用于抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特征;以及
第二获取模块,用于根据所述原始特征和所述关联特征获取搜索需求;
其中,所述抽取模块用于对所述关联词本身进行分析以抽取所述关联词的特征,所述抽取模块包括:
分词单元,用于对所述关联词进行分词以抽取与所述搜索词相关且不包含所述搜索词的多个关键词;
选择单元,用于从所述多个关键词中选择与所述搜索词需求相关的特征词,并将所述特征词作为所述多个关联词的特征;
或者,所述抽取模块用于对根据所述关联词获取的搜索结果或对用户点击日志进行分析以抽取所述关联词的特征,所述抽取模块包括:
获取单元,用于获取所述多个关联词的多个搜索结果或用户点击日志;以及
抽取单元,用于从所述多个关联词的多个搜索结果或用户点击日志中抽取所述关联词的Title特征、搜索特征和点击特征中的一种或多种,并将所述Title特征、搜索特征和点击特征中的一种或多种作为所述关联特征。
6.如权利要求5所述的搜索需求分析装置,其特征在于,所述第二获取模块具体用于:
根据所述原始特征和所述关联特征查询搜索需求识别模型以获取所述搜索需求。
7.如权利要求5所述的搜索需求分析装置,其特征在于,所述第一获取模块具体用于:
以所述搜索词为中心将与所述搜索词之间的编辑距离小于预设距离的词作为所述关联词;和/或
对所述搜索词进行语义分析,并将与所述搜索词语义近似的词作为所述关联词。
8.如权利要求5所述的搜索需求分析装置,其特征在于,所述抽取模块具体包括:
第一提取单元,用于提取所述搜索词中的专名、专名类别以及各个成分的语义TAG标签信息;
第二提取单元,用于提取所述搜索词的组成结构;
生成单元,用于根据所述搜索词中的专名、所述专名类别、所述各个成分的语义TAG信息以及所述组成结构生成所述搜索词的描述模板,并将所述描述模板作为所述原始特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410687222.5/1.html,转载请声明来源钻瓜专利网。