[发明专利]搜索默认词的配置方法、装置、计算机设备及存储介质有效
申请号: | 202110729388.9 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113536118B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王鹏 | 申请(专利权)人: | 未鲲(上海)科技服务有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951;G06F16/335;G06F16/35;G06F40/216;G06F40/30;G06F18/22;G06F18/23 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 200000 上海市自由*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 默认 配置 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及搜索配置领域,揭示了一种搜索默认词的配置方法、装置、计算机设备及存储介质,方法包括:获取第一平台的产品信息与资讯内容信息;提取所述资讯内容信息包含的内容关键词,以及根据所述产品信息筛选热度产品;获取外部平台的搜索关键词;计算所述内容关键词与所述搜索关键词的相似度,根据所述相似度确定所述第一平台的第一默认词;根据所述搜索关键词对所述热度产品进行过滤筛选,得到与所述搜索关键词相关联的目标产品,并提取所述目标产品作为所述第一平台的第二默认词;将所述第一默认词和所述第二默认词组合,得到所述第一平台的搜索默认词。本申请能够提高搜索默认词的配置效率与时效性。
技术领域
本申请涉及到搜索配置领域,特别是涉及到一种搜索默认词的配置方法、装置、计算机设备及存储介质。
背景技术
当前互联网高速发展,互联网上不同平台的搜索场景会配置默认的搜索词,目前,默认的搜索词语大部分情况是基于运营人员配置或基于用户在平台上一段时间内的统计数据计算而得到的,基于运营人员配置的方法在使用过程中过度依赖人为配置,增加额外的工作量,导致默认的搜索词的配置效率过低,且不具有时效性,基于用户在平台上一段时间内的统计数据计算而得到的存在冷启动问题,如果一段时间内用户的数据不够多则无法准确地计算出结果,导致默认的搜索词的配置准确度不高。
发明内容
本申请的主要目的为提供一种搜索默认词的配置方法、装置、计算机设备及存储介质,旨在解决目前的默认搜索词的配置效率低,准确度不高的问题。
为了实现上述发明目的,本申请提出一种搜索默认词的配置方法,包括:
获取第一平台的产品信息与资讯内容信息;
提取所述资讯内容信息包含的内容关键词,以及根据所述产品信息筛选热度产品,所述热度产品为产品的热度值在所述第一平台排序前预设位的产品;
获取外部平台的搜索关键词;
计算所述内容关键词与所述搜索关键词的相似度,根据所述相似度确定所述第一平台的第一默认词;
根据所述搜索关键词对所述热度产品进行过滤筛选,得到与所述搜索关键词相关联的目标产品,并提取所述目标产品作为所述第一平台的第二默认词;
将所述第一默认词和所述第二默认词组合,得到所述第一平台的搜索默认词。
进一步地,所述获取第一平台的产品信息与资讯内容信息,包括:
获取第一平台在指定目录下的产品信息与资讯内容信息;
所述获取外部平台的搜索关键词,包括:
根据所述指定目录确定目标外部平台;
获取基于爬虫爬取到的目标外部平台的搜索关键词。
进一步地,所述根据所述指定目录确定目标外部平台,包括:
从预设的排名榜单中获取各个不同目录的平台排名;
根据所述平台排名筛选前预设个指定目录的平台,作为目标外部平台。
进一步地,所述提取所述资讯内容信息包含的内容关键词,包括:
基于tf-idf算法提取所述资讯内容信息包含的词语;
识别所述词语的语义,基于所述语义对所述词语进行语义聚类,得到词语组;
为所述词语组匹配标签,将所述标签作为所述资讯内容信息的内容关键词;所述标签表征所述词语组中各个词语的语义。
进一步地,所述将所述第一默认词和所述第二默认词组合,得到所述第一平台的搜索默认词之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于未鲲(上海)科技服务有限公司,未经未鲲(上海)科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110729388.9/2.html,转载请声明来源钻瓜专利网。