[发明专利]一种搜索提示词的生成方法和装置在审
申请号: | 201810442164.8 | 申请日: | 2018-05-10 |
公开(公告)号: | CN108763332A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 刘维伟 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提示 搜索关键词 词集合 方法和装置 搜索 数据特征 预测模型 历史行为 权重设置 信息搜索 权重 | ||
本发明实施例提供了一种搜索提示词的生成方法和装置,搜索提示词的生成方法包括:获取用户的搜索关键词;依据搜索关键词生成搜索关键词的候选提示词集合;采用搜索关键词与候选提示词集合中每个候选提示词,生成每个候选提示词的数据特征;将数据特征输入预先训练的分值预测模型中,得到每个候选提示词的分值;依据分值,从候选提示词集合中确定搜索关键词的目标提示词。通过分值预测模型提取每个候选提示词的分值,无需人工设置权重,避免了权重设置不合理,计算得到候选提示词的分值不准确的问题,能够根据用户的历史行为客观地计算候选提示词的分值,使得提示词更符合用户的意愿,用户能够在提示词中选择所需的提示词,提高了信息搜索的效率。
技术领域
本发明涉及数据处理技术领域,具体涉及一种搜索提示词的生成方法和装置。
背景技术
随着互联网的飞速发展,网络成为人们日常生活、学习和工作必不可少的一部分。网络信息传播迅速,而且网络信息量大,用户如何在大量信息中快速地检索到有用的信息至关重要。用户输入提示也称搜索提示,通过用户在搜索框中输入部分查询的信息给出相应完整的提示词,是一种提高检索效率的方法。
目前搜索提示词主要是根据提示词的拼音前缀、简拼前缀、提示词前缀等不同来源生成。具体地,先计算搜索关键词与提示词的匹配度、统计提示词的搜索量、判断提示词是否为站内专辑、统计提示词的点击率以及提示词的新颖度(最近出现的,还是很早之前就有了),再根据经验对以上几部分给予不同的权重,然后通过对不同部分加和的方式,计算每个提示词的得分以生成提示词。
然而,目前提示词的生成方法,需要人为地为搜索关键词与提示词的匹配度、提示词的搜索量、提示词是否为站内专辑、提示词的点击率以及提示词的新颖度分配不同的权重,往往会造成搜索量大的提示词分配权重过大,或者为了反作弊行为打压热度较高的提示词的权重,又或者经验公式计算两个提示词的匹配度一致时无法对提示词进行排序的现象,从而造成根据排序生成的提示词与用户的搜索关键词不匹配、不符合用户意愿的问题,使得用户在提示词中无法进行选择,提示词也就失去了提示的意义。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种搜索提示词的生成方法和一种搜索提示词的生成装置。
为了解决上述问题,本发明实施例公开了一种搜索提示词的生成方法,包括:
获取用户的搜索关键词;
依据所述搜索关键词生成所述搜索关键词的候选提示词集合;
采用所述搜索关键词与所述候选提示词集合中每个候选提示词,生成每个候选提示词的数据特征;
将每个候选提示词的数据特征输入预先训练的分值预测模型中,得到每个候选提示词的分值;
依据每个候选提示词的分值,从所述候选提示词集合中确定所述搜索关键词的目标提示词。
可选地,所述依据所述搜索关键词生成所述搜索关键词的候选提示词集合的步骤包括:
依据所述搜索关键词,在预先设置的候选提示词词库中查找匹配的多个候选提示词;
采用所述多个候选提示词生成所述候选提示词集合。
可选地,所述采用所述搜索关键词与所述候选提示词集合中每个候选提示词,生成每个候选提示词的数据特征的步骤包括:
依据所述搜索关键词和所述每个候选提示词,分别生成搜索关键词拼音串和候选提示词拼音串;
采用所述搜索关键词拼音串和所述候选提示词拼音串生成每个候选提示词的拼音串相似度特征;
采用所述搜索关键词和所述候选提示词中的汉字串生成每个候选提示词的汉字串相似度特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810442164.8/2.html,转载请声明来源钻瓜专利网。