[发明专利]一种搜索意图的识别方法、意图识别模型训练方法和装置在审
申请号: | 201811603039.7 | 申请日: | 2018-12-26 |
公开(公告)号: | CN111368161A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 张羽 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郭化雨;朱静 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 意图 识别 方法 模型 训练 装置 | ||
本申请实施例公开了一种搜索意图的识别方法,为了确定待识别关键词是否具有官网意图,从待识别关键词所对应搜索结果中筛选出目标百科类条目,根据目标百科类条目与特征词的匹配结果确定待识别关键词的特征向量,由于特征词是根据与官网意图所关联百科类条目确定的,而目标百科类条目是根据待识别关键词搜索得到的,故确定出的特征向量可以体现出待识别关键词的官网意图信息,通过意图识别模型计算该特征向量对应的官网意图评分,官网意图评分能够表示出待识别关键词所对应搜索意图为官网意图的可能性,将官网意图评分作为搜索引擎判断待识别关键词的官网意图强弱的依据,能够提高优先展示待识别关键词对应官网的准确性,增强用户搜索体验。
技术领域
本申请涉及数据处理领域,特别是涉及搜索意图的识别以及意图识别模型的训练。
背景技术
用户在接触、了解到一些对象例如产品或者服务后,会有进一步获知该对象相关信息的需求,而该对象的相关信息,一般会较为准确、全面的记载在该对象的官网中,例如产品的官方主页、提供服务的公司网站等。
在互联网时代,用户可以通过搜索引擎满足上述需求,例如,用户输入与待了解对象相关的关键词,搜索引擎向用户展示与该关键词关联的搜索结果。在搜索过程中,如果搜索引擎能够识别出用户的搜索意图为查询官网的意图(以下简称官网意图),那么搜索引擎可以在搜索结果中优先展示该对象官网对应的条目,从而提高用户的搜索体验。
然而,目前并没有准确的识别方式用于识别搜索意图是否为官网意图。
发明内容
为了解决上述技术问题,本申请提供了一种搜索意图的识别以及意图识别模型的训练,将确定出的官网意图评分作为搜索引擎判断待识别关键词的官网意图强弱的依据,从而能够提高优先展示待识别关键词对应官网的准确性,增强用户搜索体验。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种搜索意图的识别方法,所述方法包括:
获取待识别关键词对应的搜索结果,所述搜索结果中包括目标百科类条目;
根据所述目标百科类条目的内容与特征词的匹配结果确定所述待识别关键词的特征向量;所述特征词是根据与官网意图所关联百科类条目确定的;
根据意图识别模型确定所述特征向量对应的官网意图评分,所述官网意图评分用于标识所述待识别关键词所对应搜索意图为官网意图的可能性。
可选的,所述根据所述目标百科类条目的内容与特征词的匹配结果确定所述待识别关键词对应的特征向量,包括:
根据所述目标百科类条目的内容与特征词的匹配结果,以及所述目标百科类条目的类别标签确定所述待识别关键词对应的特征向量。
可选的,所述方法还包括:
确定所述目标百科类条目与所述待识别关键词间的关联程度;
根据所述关联程度调整所述特征向量,得到调整后的特征向量;
所述根据意图识别模型确定所述特征向量对应的官网意图评分,包括:
根据意图识别模型确定所述调整后的特征向量对应的官网意图评分。
可选的,所述目标百科类条目包括多个,所述根据所述目标百科类条目的内容与特征词的匹配结果确定所述待识别关键词的特征向量,包括:
选择任意一个目标百科类条目的内容;
根据所选择的目标百科类条目的内容与所述特征词的匹配结果确定一个子特征向量;
根据多个所述目标百科类条目分别确定出的多个子特征向量计算所述待识别关键词的特征向量。
可选的,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811603039.7/2.html,转载请声明来源钻瓜专利网。