[发明专利]一种需求识别的方法及装置有效
申请号: | 201110181667.2 | 申请日: | 2011-06-30 |
公开(公告)号: | CN102855251A | 公开(公告)日: | 2013-01-02 |
发明(设计)人: | 施少杰;黄际洲 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 需求 识别 方法 装置 | ||
【技术领域】
本发明涉及计算机技术领域,特别涉及一种需求识别的方法及装置。
【背景技术】
在搜索技术中存在大量的垂直搜索需求,每一类垂直搜索都存在与其对应的搜索需求,这就需要对用户搜索请求(query)进行需求识别。
例如对于地图垂直搜索而言,现有的需求识别方法仅能够识别出用户query是否具有地图需求,对于有地图需求的用户query则在其搜索结果中加入地图垂直搜索的结果。但不同用户query可能具有不同的地图需求强度和地图需求类别,现有技术中并没有对这些进行具体的识别和区分。例如,对于某些用户query而言,其地图需求强度较高,则用户可能希望能够在搜索结果中较快地获取到地图垂直搜索的结果;对于某些用户query而言,其地图需求强度不高,则用户可能没有很大的需求要获取地图垂直搜索的结果。如果用户输入不同的用户query来表达不同的需求类型,则希望能够尽快在搜索结果中获取到对应需求类型的展现形式。但这些在现有技术中均无法实现,从而造成搜索结果的质量较低,用户需要花费更多的时间和网络资源来获取想要的搜索结果。
【发明内容】
有鉴于此,本发明提供了一种需求识别的方法和装置,能够识别出用户query对于某种服务的需求强度和需求类别,以便用于提高搜索结果的质量以及节约网络资源。
具体技术方案如下:
一种需求识别的方法,该方法包括:
A、获取用户搜索请求query;
B、根据预先建立的需求强度识别策略确定所述用户query对应的预设服务的需求强度,如果不是无预设服务的需求,则进一步利用预先建立的模板与预设服务需求类别之间的对应关系确定所述用户query对应的预设服务需求类别;
其中所述需求强度识别策略包括以下识别策略中的至少一种:
根据预设的模板与预设服务需求强度之间的对应关系进行预设服务需求强度的识别;
将包含预设特征词的用户query识别为具有与该特征词所对应的预设服务需求强度;以及,
根据预设模板和模板槽中的具体内容与预设服务需求强度之间的对应关系进行预设服务需求强度的识别。
更进一步地,在所述步骤A和步骤B之间还包括:对所述用户query进行预处理;所述预处理包括:转换为预设的大写形式或小写形式,或者,去掉预设的无意义符号。
在所述步骤A和步骤B之间还可以包括:判断所述用户query是否包含预先挖掘的黑名单词典中的词语,如果是,识别出所述用户query无预设服务的需求,结束流程;否则继续执行所述步骤B。
如果所述预设服务为地图,则所述黑名单词典的挖掘具体包括:
S11、从搜索日志中获取因用户点击搜索结果而切换到预设服务页面的用户query,统计获取的各用户query的搜索次数和切换到预设服务页面的次数;
S12、将用户query的搜索次数或者切换到预设服务页面的次数小于预设的过滤次数阈值的用户query从步骤S11获取的用户query中过滤掉;
S13、确定切换到预设服务页面的次数与搜索次数的比值小于预设黑名单比值的用户query;
S14、统计步骤S13确定的用户query中包含的词语在预先挖掘出的预设服务需求query中出现的次数,将统计的出现次数小于预设出现次数阈值的词语作为黑名单词构成黑名单词典,或者,将统计的出现次数与所在用户query对应的所述比值的平均值小于预设的平均值阈值的用户query作为黑名单词构成黑名单词典。
较优地,在所述步骤A和步骤B之间还包括:将所述用户query与预先设置的odict词典进行匹配,如果匹配成功,则确定所述用户query的预设服务的需求强度和预设服务需求类别分别为在所述odict词典中匹配到的query对应的预设服务的需求强度和预设服务需求类别,结束流程;否则继续执行所述步骤B;
其中,所述odict词典包括:搜索日志中高频出现的用户query对应的预设服务的需求强度和预设服务需求类别。
如果预设服务为地图,则所述需求强度包括:地图强需求、地图弱需求和无地图需求;
所述需求类别包括:普通地图需求、公交查询需求、线路查询需求和位置查询需求。
如果预设服务为地图,则所述模板与预设服务的需求强度之间的对应关系包括:
模板:[城市名][数字][路],对应地图高强度需求;
模板:[城市名][机构名][“地址”],对应地图高强度需求;
模板:[城市名][机构名][“在哪”],对应地图高强度需求;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110181667.2/2.html,转载请声明来源钻瓜专利网。