[发明专利]一种新闻客户端活跃度第三方预测方法有效
申请号: | 201910433268.7 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110147517B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 王严博 | 申请(专利权)人: | 中国搜索信息科技股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06Q30/02 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国栋 |
地址: | 100011 北京市大兴*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 客户端 活跃 第三 预测 方法 | ||
本发明公开了一种新闻客户端活跃度第三方预测方法,包括利用爬虫获取各新闻客户端的新闻内容;根据获取的新闻内容,定义发稿量、总阅读数、APP阅读数平衡因子、单位时间内发稿数曲率、单位时间内阅读数曲率、稿件评论数和单位时间内评论数;根据定义的参数,采用活跃度数值公式,预测各新闻客户端的活跃度。优点是:使用该方法能够平滑准确依据不同客户端进行自适应参数调节,避免了因单一客户端统计数据横向对比度无法衡量的问题;采用了基于机器学习方法,实现了新闻客户端活跃度预测,方便新闻工作人员、广告投放人员、舆情工作人员进一步利用预测结果,进行工作效果提前预判。
技术领域
本发明涉及统计学领域,尤其涉及一种新闻客户端活跃度第三方预测方法。
背景技术
新闻资讯作为互联网行业最受关注的行业应用之一,新闻客户端更是层出不穷,为了评估新闻媒体影响力,所在新闻客户端客户的评估,在当前互联网下更是重中之重。各家新闻客户端的活跃用户数的单向宣布方式,对上下游使用者来说,缺乏一个公开、统一的衡量尺度。
发明内容
本发明的目的在于提供一种新闻客户端活跃度第三方预测方法,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种新闻客户端活跃度第三方预测方法,包括如下步骤,
一种新闻客户端活跃度第三方预测方法,包括如下步骤,
S1、利用爬虫获取各新闻客户端的新闻内容,并根据不同新闻客户端发帖数量的差异,设置各新闻客户端的采样常量,且所有的新闻客户端都遵循同一个采样周期;
S2、根据获取的新闻内容,定义发稿量、总阅读数、APP阅读数平衡因子、单位时间内发稿数曲率、单位时间内阅读数曲率、稿件评论数和单位时间内评论数;
S3、根据步骤S2中定义的参数,采用活跃度数值公式,预测各新闻客户端的活跃度。
优选的,所述发稿量为某一新闻客户端在采样周期内发布的稿件数量总和;所述稿件指该新闻客户端列表中可见的文章,定义为Ps;所述总阅读数为该新闻客户端在采样周期内所有稿件的总和,定义为Vs;所述APP阅读数平衡因子为令该新闻客户端的阅读数拟合到统一基准的平衡因子,定义为Avgs;所述单位时间内发稿数曲率为该新闻客户端在采样周期内单位时间的发稿数曲率,定义为Dpr,其通过如下公式进行取值,
所述单位时间内阅读数曲率为该新闻客户端在采样周期内单位时间的阅读数曲率,定义为Vpr,其通过如下公式进行取值,
所述稿件评论数为该新闻客户端的所有原创稿件的评论数总和;所述单位时间内评论数为该新闻客户端在采样周期内单位时间内评论数,定义为Cpr,其通过如下公式进行取值,
优选的,所述活跃度数值公式如下,
其中,Dau为新闻客户端的活跃度;Rri为惩罚系数;i为计算周期;Maxi为一个计算周期内最大的活跃数;Mini为一个计算周期内最小的活跃数。
优选的,惩罚系数的取值如下,
其中,x表示评论浏览活跃比。
优选的,所述x由如下公式计算获得,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国搜索信息科技股份有限公司,未经中国搜索信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910433268.7/2.html,转载请声明来源钻瓜专利网。