[发明专利]一种获取新闻热点的方法、设备及存储介质有效
申请号: | 201810552297.0 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108897774B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 高锐;李浩;吴伊竹 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/906 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 新闻 热点 方法 设备 存储 介质 | ||
1.一种获取热点新闻的方法,其特征在于,包括:
确定每个新闻发布源各自对应的热点新闻版面,其中,不同的新闻发布源对应的热点新闻版面上热点新闻的排布区域不同,针对不同的新闻发布源配置有不同的热点新闻获取模板;
从所述每个新闻发布源各自对应的热点新闻版面的相应位置上,获取所述每个新闻发布源各自的热点新闻,作为初始热点新闻;
分析所述初始热点新闻所来自的新闻发布源的链接信息,确定所述初始热点新闻所属的预估领域;
根据所述初始热点新闻的正文关键字,以及所述预估领域的中心向量进行余弦相似度计算;
若所述余弦相似度大于预设阈值,则确定所述预估领域为所述初始热点新闻所属领域,其中,若所述预估领域为所述初始热点新闻所属领域,则将所述初始热点新闻的正文关键字向量添加到所述预估领域的领域集合中,并将所述预估领域的中心向量变更为两个相似向量的几何中心点,使所述预估领域的中心向量逐步收敛;
针对同一所属领域中的初始热点新闻,将相似度大于相似度阈值的初始热点新闻聚类为一个中间热点新闻;
将热度大于热度阈值的中间热点新闻,以及热度大于所述热度阈值的未被聚类的初始热点新闻确定为目标热点新闻。
2.根据权利要求1所述的方法,其特征在于,所述获取所述每个新闻发布源各自的热点新闻,包括:
获取所述每个新闻发布源在获取时间段内的热点新闻,所述在获取时间段内的热点新闻包括所述获取时间段起始时刻的热点新闻和在获取过程中新闻发布源页面经刷新后新增的热点新闻。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对同一领域中的初始热点新闻,确定实体和关键字,所述实体为所述新闻中的参与方对象;
根据所述实体和关键字,确定所述同一领域中各初始热点新闻的相似度。
4.根据权利要求3所述的方法,其特征在于,所述根据所述实体和关键字,确定所述同一领域中各初始热点新闻的相似度,包括:
确定同一实体在所述同一领域中各初始热点新闻中出现的次数及位置;
根据所述次数及位置,确定所述同一领域中满足初始聚类条件的初始热点新闻;
对于所述满足初始聚类条件的初始热点新闻中的每个初始热点新闻,按照关键字对所述每个初始热点新闻进行相似度打分。
5.根据权利要求1-2任一所述的方法,其特征在于,所述方法还包括:
根据所述中间热点新闻所对应的初始热点新闻所属新闻发布源的权威等级、所对应的初始热点新闻的被浏览量和被关注量,确定所述中间热点新闻的热度;
根据所述未被聚类的初始热点新闻所属新闻发布源的权威等级、被浏览量和被关注量,确定所述未被聚类的初始热点新闻的热度。
6.根据权利要求1-2所述的方法,其特征在于,所述方法还包括:
接收终端发送的热点请求;
根据所述热点请求,确定当前的所述目标热点新闻;
向所述终端发送所述当前的所述目标热点新闻。
7.根据权利要求6所述的方法,其特征在于,所述向所述终端发送所述当前的所述目标热点新闻时,所述方法还包括:
向所述终端发送所述当前的目标热点新闻的显示样式指示信息,所述显示样式指示信息用于指示所述终端按照所述显示样式显示所述当前的目标热点新闻。
8.根据权利要求6所述的方法,其特征在于,所述向所述终端发送所述当前的目标热点新闻时,所述方法还包括:
向所述终端发送所述当前的目标热点新闻中各目标热点新闻的热度排序,所述热度排序用于所述终端将目标热点新闻分配到预设的显示样式中进行展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810552297.0/1.html,转载请声明来源钻瓜专利网。