[发明专利]搜索结果的获取方法和装置、存储介质及电子装置有效
申请号: | 201910735773.7 | 申请日: | 2019-08-09 |
公开(公告)号: | CN110489525B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 安明洋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F40/289 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 张学渊 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 结果 获取 方法 装置 存储 介质 电子 | ||
本发明公开了一种搜索结果的获取方法和装置、存储介质及电子装置。其中,该方法包括:对第一帐号输入的第一搜索词进行分词,得到第一目标字段;在预定的时新性分值表中获取该第一目标字段对应的时新分值,其中,该时新性分值表中记录有多组数据,每组数据包括一对具有对应关系的字段和时新分值,该字段对应的时新分值与包含该字段的搜索词的长转化次数呈正相关;根据该第一搜索词的时新分值获取与该第一搜索词对应的待传输的第一搜索结果;向该第一帐号传输该第一搜索结果。本发明解决了相关技术中由于不能准确地获取搜索词的时新性导致搜索结果不准确的技术问题。
技术领域
本发明涉及信息搜索领域,具体而言,涉及一种搜索结果的获取方法和装置、存储介质及电子装置。
背景技术
相关技术中辜斯缪在《搜索日志的挖掘方法、时新性需求识别的方法及对应装置》一文中描述了一种计算时新概率表的方法,如图1所示,包括以下步骤:
步骤101,分词处理,对搜索词日志分词;
步骤102,对各词语进行标注分类、归纳,得到字段的类型;
步骤103,对搜索词进行筛选;即同时对用户点击较新结果的分析,将搜索词分为时新搜索词集合,和非时新搜索词集合
步骤104,概率计算,即汇总字段分类以及搜索词,计算概率,得到各个类型对应的时新性概率表。
如图2所示,用户的搜索词query的时新性判断包括以下步骤:
步骤201,分词处理,接收到用户输入的query,线上用户请求时,通过分词处理;
步骤202,标准归纳,对各词语进行标注归纳得到类型;
步骤203,查表,即查时新性概率表;
步骤204,时新性确定,即依据时新性概率得到最终query的时新性概率;
步骤205,提高搜索结果中时间属性的排序权值。
上述的相关技术存在以下问题:
问题1,相关技术在原始排序可以暴露高质量并且足够多的新结果的情况下,可以很好的工作。但是,如果某个query的原始排序中,用户很难发现新的结果并产生点击,使用上述相关技术,则无法正确区分时新性query集合和非时新性query集合,对query的时新性判断也就会出现问题。
问题2,相关技术使用用户点击来发觉时新query,但是用户点击容易被标题等信息影响,不够准确。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种搜索结果的获取方法和装置、存储介质及电子装置,以至少解决相关技术中由于不能准确地获取搜索词的时新性导致搜索结果不准确的技术问题。
根据本发明实施例的一个方面,提供了一种搜索结果的获取方法,包括:对第一帐号输入的第一搜索词进行分词,得到第一目标字段;在预定的时新性分值表中获取所述第一目标字段对应的时新分值,其中,所述时新性分值表中记录有多组数据,每组数据包括一对具有对应关系的字段和时新分值,所述字段对应的时新分值与包含所述字段的搜索词的长转化次数呈正相关,所述长转化次数用于表示在将所述搜索词作为搜索条件进行搜索时得到的搜索结果中部分结果被点击且展示时间超过阈值的次数,所述部分结果为信息发布时刻与搜索时刻的间隔小于目标时间段的信息;根据所述第一目标字段对应的时新分值获取所述第一搜索词的时新分值;根据所述第一搜索词的时新分值获取与所述第一搜索词对应的待传输的第一搜索结果;向所述第一帐号传输所述第一搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910735773.7/2.html,转载请声明来源钻瓜专利网。