[发明专利]一种查询词分类模型的确定方法和装置在审
申请号: | 201811243106.9 | 申请日: | 2018-10-24 |
公开(公告)号: | CN111177521A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 孙玉玺;丁文彪;周泽南;苏雪峰;商磊;马龙 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/906;G06F16/532 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郭化雨;朱静 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 查询 分类 模型 确定 方法 装置 | ||
本申请实施例公开了一种查询词分类模型的确定方法和装置,通过图像分类模型对历史查询结果中的图像进行识别,如果一个历史查询结果中包括了目标类型的图像,那么确定这个历史查询结果对应的历史查询词的类型为该目标类型。可以将识别出的该目标类型的历史查询词训练查询词分类模型,从而该查询词分类模型可以实现识别查询词的类型是否为目标类型的功能。当需要确定查询词的类型是否为目标类型时,不再需要人工标注,直接通过该查询词分类模型即可实现,提高了查询词类型的识别效率。
技术领域
本申请涉及数据处理领域,特别是涉及一种查询词分类模型的确定方法和装置。
背景技术
用户通过搜索引擎输入查询词,可以获得与该查询词相关的查询结果。
搜索引擎如果能够确定查询词的类型或者说查询词对应的查询意图,可以基于查询词类型有针对性的进行搜索,从而提高搜索效率以及搜索准确性。目前针对查询词类型的识别主要是通过人工识别、标注的方式,为查询词手动标注上人工识别出的类型标签。
这种方式效率很低,远远跟不上用户所使用查询词的更新速度,难以适用于当前的网络搜索需求。
发明内容
为了解决上述技术问题,本申请提供了一种查询词分类模型的确定方法和装置,直接通过该查询词分类模型即可实现,提高了查询词类型的识别效率。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种查询词分类模型的确定方法,所述方法包括:
根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词;
根据所述目标类型的历史查询词训练查询词分类模型,所述查询词分类模型用于识别查询词的类型是否为所述目标类型。
可选的,所述方法还包括:
获取所述目标类型的图像集合;
根据所述图像集合训练所述图像分类模型,所述图像分类模型用于识别图像的类型是否为所述目标类型。
可选的,所述方法还包括:
根据所述查询词分类模型识别待识别查询词的类型是否为所述目标类型;
若是,根据所述图像分类模型识别所述待识别查询词所对应目标查询结果中图像的类型。
可选的,若所述目标类型为敏感类型,所述根据所述图像分类模型识别所述待识别查询词所对应目标查询结果中图像的类型,包括:
若识别所述目标查询结果中包括所述敏感类型的图像,取消对所述目标查询结果中所述敏感类型的图像的展示。
可选的,所述方法还包括:
根据所述待识别查询词的敏感类型对应的敏感等级,确定所述图像分类模型识别敏感类型时所采用的确定条件。
可选的,所述将包括所述目标类型的图像的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词,包括:
将包括所述目标类型的图像、且所述目标类型的图像所占比例满足预定条件的历史查询结果所对应历史查询词确定为所述目标类型的历史查询词。
第二方面,本申请实施例提供了一种查询词分类模型的确定装置,所述装置包括第一识别单元、类型确定单元和第一训练单元:
所述第一识别单元,用于根据图像分类模型识别历史查询词所对应历史查询结果中是否包括目标类型的图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811243106.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:微电网仿真方法及装置
- 下一篇:一种可移动的空调及智能家居系统