[发明专利]一种识别搜索需求的方法和装置有效
申请号: | 201110273329.1 | 申请日: | 2011-09-15 |
公开(公告)号: | CN102999521A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 黄际洲;柴春光 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种识别搜索需求的方法和装置,预先建立各预设类型的需求分析模型,具体为:获得该预设类型的种子query的各n元词组(n-gram),计算每一个n-gram与该预设类型的语义相似度(sim)以及属于该预设类型的概率(prob);利用sim和prob确定每一个n-gram在该预设类型的评分。接收到待识别query时,确定待识别query的各n-gram;查询各预设类型的需求分析模型,确定各n-gram在各预设类型的评分;利用确定的所有n-gram在每一个预设类型的评分之和得到待识别query在每一个预设类型上有需求的可能性,进而识别出待识别query的需求类型。本发明能够提高需求识别的适用性和准确性。 | ||
搜索关键词: | 一种 识别 搜索 需求 方法 装置 | ||
【主权项】:
一种识别搜索需求的方法,其特征在于,该方法包括:预先建立各预设类型的需求分析模型;接收到待识别query时,利用所述需求分析模型对所述待识别query进行需求识别;其中,所述预设类型的需求分析模型的建立具体包括:S1、获得该预设类型的种子query的各n元词组n‑gram,n为预设的一个或多个正整数;S2、计算每一个n‑gram与该预设类型的语义相似度sim以及每一个n‑gram属于该预设类型的概率prob;S3、利用所述sim和所述prob确定每一个n‑gram在该预设类型的评分;对所述待识别query进行需求识别具体包括:S4、确定所述待识别query的各n‑gram;S5、查询各预设类型的需求分析模型,确定步骤S4确定的各n‑gram在各预设类型的评分;S6、利用步骤S4确定的所有n‑gram在每一个预设类型的评分之和得到所述待识别query在每一个预设类型上有需求的可能性;S7、根据所述待识别query在每一个预设类型上有需求的可能性识别出所述待识别query的需求类型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110273329.1/,转载请声明来源钻瓜专利网。