[发明专利]一种基于网络热度的热点事件智能排序算法在审
申请号: | 201910907158.X | 申请日: | 2019-09-24 |
公开(公告)号: | CN110825958A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 张晓东;陈利人;杨学政 | 申请(专利权)人: | 广州数知科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/958;G06F16/35;G06F16/33;G06F40/211 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 陈远洋 |
地址: | 511458 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 热度 热点 事件 智能 排序 算法 | ||
本发明公开了一种基于网络热度的热点事件智能排序算法,包括算法准备、算法参数生成算法和热点事件智能排序算法三个部分;其中,算法准备是指在算法实施前的参数准备工作;算法参数生成算法是指各算法中所有参数生成的计算方式;热点事件智能排序算法是指综合算法准备和算法参数生成算法两部分,计算热点事件的热度λ。本发明所提供的算法,即综合考虑热点事件的来源权威性、事件关键词的传播能力和基于历史大数据的事件趋势变化规律,能较全面、科学地体现热点事件的热度,由此得到的热度数据作为排序的依据,可适用于各类热点新闻事件的盘点、排序,进而指导舆情监控、营销选题等业务。
【技术领域】
本发明涉及一种算法,特别涉及一种基于网络热度的热点事件智能排序算法。
【背景技术】
热点事件,是指发生在现实世界中发生并在互联网中广泛传播的、受到广大网民关注的事件。热点事件排序,是指对热点事件进行排序。
现行主流热点事件排序,大多根据单一新闻网站的搜索热度或传播范围,即搜索量或转发数量越大,热点事件排序越靠前。具体过程为:首先取得大规模的文本;对文本进行预处理;对文本进行聚类分析;聚类结果排序;输出结果。对于网络热点事件来说,不同新闻报道的角度不同,各新闻源的热点事件排序规则不同,内容可能会有较大差异,采用传统的排序方法准确率不高,无法准确反映网络上的热点事件热度。
单一新闻源的热点事件热度排序规则不同,多源聚合时,依据其来源进行排序时,不能按照统一规则排序,不能体现热点时间的综合热度,造成排序混乱。即便采用了复合算法,如新闻源自有数据(新闻源中排名、搜索量、转发量)的加权计算,也往往过于粗糙,未能综合体现热点时间的传播特点。
另外,热点事件大多源自新闻类网站,未能参考在民众中传播力极广的社交类网站中的热点事件。这就使得最终得到的排序后的热点事件列表超出人们认知,造成“热点不热”的错觉。
【发明内容】
本发明的目的在于克服上述现有技术的不足,采用如下技术方案:
一种基于网络热度的热点事件智能排序算法,包括以下三个部分:
S1:算法准备:在算法实施前的参数准备工作,包括获取新闻源、获取热点新闻、对热点新闻进行分类及获取历史热点新闻热度升降数据;
S2:算法参数生成算法:各算法中所有参数生成的计算方式,包括新闻源参数α生成算法、标题关键词参数β算法、热度升降趋势参数γ算法;
S3:热点事件智能排序算法:综合S1和S2两部分,计算热点事件的热度λ。
进一步地,获取新闻源是指确定互联网热点新闻的来源网站,并根据网站性质为网站打上标签。
进一步地,获取热点新闻中需要获取的字段包括:新闻标题、文章内容、在来源网站中的排序和传播数据θ。
进一步地,对热点新闻进行分类是指利用NLP中的文本聚合技术对获取到的热点新闻的内容进行聚合,再利用NLP技术中的Knn分类算法对聚合后的内容重新进行分类。
进一步地,获取历史热点新闻热度升降数据是指抓取并持续跟踪历史热点事件的热度数据,用以学习各类热点事件的热度升降趋势,进而指导最终事件的热度趋势预测。
进一步地,新闻源参数α是指多个新闻源按照评分由高到低进行排序后的排名。
进一步地,S2中还包括标题文法依存分析,标题文法依存分析是指找出新闻标题中的一个或多个核心关键词。
进一步地,标题关键词参数β是指将每个新闻标题中的多个关键词的重要性评分相加后求取的平均值由高到底进行排序后的排名。
进一步地,热度升降趋势参数γ取决于热点事件的传播数据θ,示意公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州数知科技有限公司,未经广州数知科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910907158.X/2.html,转载请声明来源钻瓜专利网。