[发明专利]一种基于网络热度的热点事件智能排序算法在审
申请号: | 201910907158.X | 申请日: | 2019-09-24 |
公开(公告)号: | CN110825958A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 张晓东;陈利人;杨学政 | 申请(专利权)人: | 广州数知科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/958;G06F16/35;G06F16/33;G06F40/211 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 陈远洋 |
地址: | 511458 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 热度 热点 事件 智能 排序 算法 | ||
1.一种基于网络热度的热点事件智能排序算法,其特征在于:该算法包括以下三个部分:
S1:算法准备:在算法实施前的参数准备工作,包括获取新闻源、获取热点新闻、对热点新闻进行分类及获取历史热点新闻热度升降数据;
S2:算法参数生成算法:各算法中所有参数生成的计算方式,包括新闻源参数α生成算法、标题关键词参数β算法、热度升降趋势参数γ算法;
S3:热点事件智能排序算法:综合S1和S2两部分,计算热点事件的热度λ。
2.根据权利要求1所述的一种基于网络热度的热点事件智能排序算法,其特征在于:获取新闻源是指确定互联网热点新闻的来源网站,并根据网站性质为网站打上标签。
3.根据权利要求1所述的一种基于网络热度的热点事件智能排序算法,其特征在于:获取热点新闻中需要获取的字段包括:新闻标题、文章内容、在来源网站中的排序和传播数据θ。
4.根据权利要求1所述的一种基于网络热度的热点事件智能排序算法,其特征在于:对热点新闻进行分类是指利用NLP中的文本聚合技术对获取到的热点新闻的内容进行聚合,再利用NLP技术中的Knn分类算法对聚合后的内容重新进行分类。
5.根据权利要求1所述的一种基于网络热度的热点事件智能排序算法,其特征在于:获取历史热点新闻热度升降数据是指抓取并持续跟踪历史热点事件的热度数据,用以学习各类热点事件的热度升降趋势,进而指导最终事件的热度趋势预测。
6.根据权利要求1所述的一种基于网络热度的热点事件智能排序算法,其特征在于:新闻源参数α是指多个新闻源按照评分由高到低进行排序后的排名。
7.根据权利要求1所述的一种基于网络热度的热点事件智能排序算法,其特征在于:S2中还包括标题文法依存分析,标题文法依存分析是指找出新闻标题中的一个或多个核心关键词。
8.根据权利要求1所述的一种基于网络热度的热点事件智能排序算法,其特征在于:标题关键词参数β是指将每个新闻标题中的多个关键词的重要性评分相加后求取的平均值由高到底进行排序后的排名。
9.根据权利要求1所述的一种基于网络热度的热点事件智能排序算法,其特征在于:热度升降趋势参数γ取决于热点事件的传播数据θ,示意公式如下:
其中,θt1表示在t1时刻的传播数据,θt2表示在t2时刻的传播数据。
10.根据权利要求1所述的一种基于网络热度的热点事件智能排序算法,其特征在于:计算热点事件的热度λ的示意公式如下:
λ=|γλ=|γ×α×β|
λ数值从大到小排序,即为多个热点事件的最终排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州数知科技有限公司,未经广州数知科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910907158.X/1.html,转载请声明来源钻瓜专利网。