[发明专利]一种新闻热度的计算方法有效
申请号: | 201911398849.8 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111143655B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 龚才春;姜勇越 | 申请(专利权)人: | 创新奇智(青岛)科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/35 |
代理公司: | 深圳珠峰知识产权代理有限公司 44899 | 代理人: | 黄伟 |
地址: | 266200 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 热度 计算方法 | ||
本发明公开一种新闻热度的计算方法,涉及计算机技术领域,包括:对具有预设权威度的各新闻站点进行数据爬取得到若干新闻数据;进行新闻标签分类,得到具有新闻标签的各新闻数据;新闻事件库中具有若干新闻事件子集合时,将各新闻数据进行整体聚类,否则进行增量聚类;统计每个新闻事件子集合中的新闻数量以及新闻报道时间;对每个新闻事件子集合的各新闻数据进行排序,并根据排序结果进行权重赋值得到第一权重;处理得到各新闻数据被转发和转载量;对预设权威度、新闻标签、新闻数量、新闻报道时间、第一权重以及被转发和转载量进行加权求和得到新闻热度值。本发明考虑多个影响新闻热度的因素,计算得出的新闻热度更加全面,合理,符合实际。
技术领域
本发明涉及计算机技术领域,具体涉及一种新闻热度的计算方法。
背景技术
随着互联网的发展,各式新媒体涌现,流量之争愈演愈烈,提高新闻热度成为媒体运营中心。现有的新闻热度的计算主要包括基于用户行为数据,基于舆情分析以及基于聚类计算。
点赞、转发、评论、收藏等行为统称为用户行为,用户行为体现出的用户对该新闻的关注度,因此用户行为的统计是新闻热度的最直接表达形式。但是很多新闻门户网站或者不统计用户行为,或者隐藏用户行为,这对第三方获取新闻数据时就无法直接通过信息抽取来计算新闻热度。
舆情分析针对这类问题的解决方法是,通过新闻聚类,从媒体的角度去讨论新闻的热度,但是没有考虑增量聚类。新闻是一天天积累的,虽然现在的硬件配置可以支持大量的数据聚类,但是长时间的积累之后,如果每次都是整体聚类的话,势必会影响计算效率。
通过聚类计算新闻热度的算法中,考虑新闻自身的差异性不够全面。同属一个事件的新闻,也会因为报道时间或者网站的等级,亦或者网友的参与等多种因素造成新闻与新闻之间的价值不同,将这些因素考虑进去可以更好地进行热点新闻内容的挖掘,有助于更好的分析热点事件。
同时,由于不同的门户网站实际上是有不同的级别的,也就是网站的权威度,而现阶段针对新闻热度的计算没有考虑此因素。事实上现有的新闻热度的计算方法考虑的因素很少,不能够全面反映新闻的热度。
发明内容
本发明的目的在于提供一种新闻热度的计算方法。
为达此目的,本发明采用以下技术方案:
提供一种新闻热度的计算方法,具体包括以下步骤:
步骤S1,采用爬虫机制对具有预设权威度的各新闻站点进行数据爬取,爬取得到各所述新闻站点的对应于所述预设权威度的若干新闻数据;
步骤S2,根据预先生成的新闻标签分类模型对各所述新闻数据进行新闻标签分类,得到具有对应新闻标签的各所述新闻数据;
步骤S3,判断预先生成的新闻事件库中是否存在具有对应聚类类别的若干新闻事件子集合:
若否,则转向步骤S4;
若是,则转向步骤S5;
步骤S4,将具有所述新闻标签的各所述新闻数据进行整体聚类,得到具有所述聚类类别的若干所述新闻事件子集合并存储在所述新闻事件库中,随后转向步骤S6;
步骤S5,将具有所述新闻标签的各所述新闻数据进行增量聚类,得到各所述新闻数据的所述聚类类别,并将所述新闻数据加入对应于所述聚类类别的所述新闻事件子集合中进行存储,以对所述新闻事件库进行更新;
步骤S6,根据所述新闻事件库,统计得到每个所述新闻事件子集合中包含的各所述新闻数据的新闻数量以及新闻报道时间;
步骤S7,对所述新闻事件库中每个所述新闻事件子集合包含的各所述新闻数据进行排序,并根据排序结果对每个所述新闻数据进行权重赋值,得到各所述新闻数据对应的第一权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(青岛)科技有限公司,未经创新奇智(青岛)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911398849.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:资源推荐方法及装置
- 下一篇:时间推移地震观测方法及装置