[发明专利]一种搜索词的处理方法、装置及计算机可读存储介质在审
申请号: | 201810000847.8 | 申请日: | 2018-01-02 |
公开(公告)号: | CN110019738A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 段福高;冯俊兰;胡珉;王燕蒙;邓路 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张振伟;张颖玲 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索串 权重 检索 计算机可读存储介质 焦点 搜索词 词性 数据库 检索结果 | ||
本发明公开了一种搜索词的处理方法、装置及计算机可读存储介质。其中,方法包括:获取输入的搜索串;所述搜索串包含至少两个关键词;确定所述搜索串中每个关键词的词性;利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的检索结果。
技术领域
本发明涉及智能问答搜索技术领域,尤其涉及搜索词的处理方法、装置及计算机可读存储介质。
背景技术
目前大部分搜索引擎的搜索方式是用户向搜索引擎提交查询串,搜索引擎返回一系列与用户提交的查询相关的结果,用户在结果中寻找符合自身需求的信息。因此,搜索引擎需要通过用户提交的查询串去理解用户的真实需求。为了更好地理解用户意图,让搜索结果更加准确,对搜索查询串进行优化处理是信息检索领域中的一个基本问题。
目前,搜索查询串进行优化处理的解决方案主要包括:对搜索查询串进行关键词扩展;对搜索查询串中关键词进行权重调整;对搜索查询串中关键词扩展结合权重调整。
然而,这些方案中有些方案的检索精度较差,有些方案的检索结果不能够真正代表用户的查询意图。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种搜索词的处理方法、装置及计算机可读存储介质。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种搜索词的处理方法,包括:
获取输入的搜索串;所述搜索串包含至少两个关键词;
确定所述搜索串中每个关键词的词性;
利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词;
获取所述焦点关键词的扩展关键词;并确定所述焦点关键词及扩展关键词的权重;所述焦点关键词的权重高于所述搜索串中的其它关键词的权重,且高于所述扩展关键词的权重;
利用确定的各关键词的权重、所述搜索串的各关键词以及扩展关键词,生成检索串;所述检索串用于对数据库进行检索,获取在数据库进行检索后的检索结果。
上述方案中,确定所述搜索串中每个关键词的词性,包括:
确定所述搜索串中每个关键词的词性为动词、或为名词、或为数量词。
上述方案中,所述利用确定的每个关键词的词性,从所述至少两个关键词中确定焦点关键词,包括:
利用确定的每个关键词的词性,确定所述搜索串所形成的短语结构类型;
利用确定的短语结构类型,从所述至少两个关键词中确定焦点关键词。
上述方案中,所述利用确定的短语结构类型,从所述至少两个关键词中确定焦点关键词,包括:
当短语结构类型为名词结构、或为主谓结构时,从词性为名词的各关键词中确定所述焦点关键词;
或者,
当短语结构类型为主谓结构,且词性包含数量词时,从词性为名词和数量词的各关键词中确定所述焦点关键词。
上述方案中,所述当短语结构类型为主谓结构时,从词性为名词的各关键词中确定所述焦点关键词,包括:
将词性为名词,且与词性为动词的关键词形成主谓关系的关键词作为所述焦点关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810000847.8/2.html,转载请声明来源钻瓜专利网。