[发明专利]一种新媒体稿件热度计算方法有效
申请号: | 202010879450.8 | 申请日: | 2020-08-27 |
公开(公告)号: | CN112015965B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 王严博 | 申请(专利权)人: | 中国搜索信息科技股份有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06F16/906 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国强 |
地址: | 100077 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 媒体 稿件 热度 计算方法 | ||
1.一种新媒体稿件热度计算方法,其特征在于,包括以下步骤:
S1)采集新媒体平台的稿件数据,在预设周期内利用爬虫程序分别抓取t个新媒体平台的若干篇稿件,获得每篇稿件的稿件参数,所述稿件参数包括稿件的阅读数、点赞数、评论数、发布时间和抓取时间;
S2)判断第m个新媒体平台的每篇稿件的阅读数超过限值后是否能显示具体阅读数,1≤m≤t,若是,则进入步骤S3);若否,则构建新媒体稿件阅读数预测模型,根据所述新媒体稿件阅读数预测模型获得第m个新媒体平台中不能显示具体阅读数的稿件的阅读数;
步骤S2)中,构建新媒体稿件阅读数预测模型,根据所述新媒体稿件阅读数预测模型获得第m个新媒体平台中不能显示具体阅读数的稿件的阅读数,包括以下步骤:
S21)获取第m个新媒体平台中阅读数能正常显示的n篇稿件的稿件数据,获得训练数据集si表示获取的阅读数能正常显示的第i篇稿件的稿件数据,si=[Li,Ci,Ri],Li表示阅读数能正常显示的第i篇稿件的点赞数,Ci表示阅读数能正常显示的第i篇稿件的评论数,Ri表示阅读数能正常显示的第i篇稿件的阅读数,i=0,1,2,...,n;
S22)将阅读数能正常显示的第i篇稿件的点赞数与评论数之间的比值作为分类值,根据分类值建立5个分类区间θ0、θ1、θ2、θ3分别表示分类区间的4个阈值;
S23)根据步骤S22)中的5个分类区间对训练数据集S进行分类,获得5类训练数据集,按照阅读数由小到大的顺序对5类训练数据集进行排序,获得分类且排序后的第j类训练数据集j=1,2,...,5,n1+n2+…+nj+…+n5=n;
S24)以k为窗口对分类且排序后的第j类训练数据集Sj进行滑动累加,获得滑动累加后的第j类训练数据集a0j表示第j类训练数据集Sj中的前k+1个行向量的元素累加和;表示第j类训练数据集Sj中的第nj-k个行向量至第nj个行向量的元素累加和向量;表示第j类训练数据集第nj-1行的点赞数累加和,表示第j类训练数据集第nj-1行的评论数累加和,表示第j类训练数据集第nj-1行的阅读数累加和;
S25)将步骤S24)中滑动累加后的每一类训练数据集划分为训练集和测试集,将滑动累加后的每一类训练数据集中每一行的点赞数累加和、每一行的评论数累加和作为自变量,将每一行的阅读数累加和作为因变量进行回归分析,获得与5个分类区间相对应的5个新媒体稿件阅读数预测模型,
当Mi<θ0时,r1=ω11b+ω12l+ω13c+ω14lc+ω15l2+ω16c2+ω17l3+ω18l2c+ω19l2c+ω110c3;
当θ0≤Mi<θ1时,r2=ω21b+ω22l+ω23c+ω24lc+ω25l2+ω26c2;
当θ1≤Mi<θ2时,r3=ω31b+ω32l+ω33c;
当θ2≤Mi<θ3时,
r4=ω41b+ω42l+ω43c+ω44lc+ω45l2+ω46c2+ω47l3+ω48l2c+ω49l2c+ω410cC3;
当θ3≤Mi时,r5=ω51b+ω52l+ω53c+ω54lc+ω55l2+ω56c2+ω57l3+ω58l2c+ω59l2c+ω510c3;ωjv表示第j个新媒体稿件阅读数预测模型的第v个权重,b为常数,l为待输入的点赞数,c为待输入的评论数,rj表示第j个新媒体稿件阅读数预测模型预测的阅读数;
S26)获得第m个新媒体平台中不能显示具体阅读数的稿件的点赞数和评论数,根据不能显示具体阅读数的稿件的点赞数与评论数之间的比值确定所述不能显示具体阅读数的稿件的分类区间、以及与所述不能显示具体阅读数的稿件的分类区间相对应的新媒体稿件阅读数预测模型,将所述不能显示具体阅读数的稿件的点赞数与评论数带入新媒体稿件阅读数预测模型中,获得第m个新媒体平台中不能显示具体阅读数的稿件的阅读数;
S3)根据稿件参数建立稿件热度计算模型,获得若干个新媒体平台在时间维度上衰减后的稿件热度;
S4)根据步骤S3)中的稿件热度计算模型对不同新媒体平台的稿件热度进行计算并排序,分别得到各个新媒体平台的稿件热度排行榜。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国搜索信息科技股份有限公司,未经中国搜索信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010879450.8/1.html,转载请声明来源钻瓜专利网。