[发明专利]一种新闻客户端活跃度第三方预测方法有效
申请号: | 201910433268.7 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110147517B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 王严博 | 申请(专利权)人: | 中国搜索信息科技股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06Q30/02 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国栋 |
地址: | 100011 北京市大兴*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 客户端 活跃 第三 预测 方法 | ||
1.一种新闻客户端活跃度第三方预测方法,其特征在于:包括如下步骤,
S1、利用爬虫获取各新闻客户端的新闻内容,并根据不同新闻客户端发帖数量的差异,设置各新闻客户端的采样常量,且所有的新闻客户端都遵循同一个采样周期;
S2、根据获取的新闻内容,定义发稿量、总阅读数、APP阅读数平衡因子、单位时间内发稿数曲率、单位时间内阅读数曲率、稿件评论数和单位时间内评论数;
S3、根据步骤S2中定义的参数,采用活跃度数值公式,预测各新闻客户端的活跃度;
所述发稿量为某一新闻客户端在采样周期内发布的稿件数量总和;所述稿件指该新闻客户端列表中可见的文章,定义为Ps;所述总阅读数为该新闻客户端在采样周期内所有稿件的总和,定义为Vs;所述APP阅读数平衡因子为令该新闻客户端的阅读数拟合到统一基准的平衡因子,定义为Avgs;所述单位时间内发稿数曲率为该新闻客户端在采样周期内单位时间的发稿数曲率,定义为Dpr,其通过如下公式进行取值,
所述单位时间内阅读数曲率为该新闻客户端在采样周期内单位时间的阅读数曲率,定义为Vpr,其通过如下公式进行取值,
所述稿件评论数为该新闻客户端的所有原创稿件的评论数总和;所述单位时间内评论数为该新闻客户端在采样周期内单位时间内评论数,定义为Cpr,其通过如下公式进行取值,
所述活跃度数值公式如下,
其中,Dau为新闻客户端的活跃度;Rri为惩罚系数;i为计算周期;Maxi为一个计算周期内最大的活跃数;Mini为一个计算周期内最小的活跃数;cr表示评论活跃度;dr表示发稿活跃度;vr表示浏览活跃度。
2.根据权利要求1所述的新闻客户端活跃度第三方预测方法,其特征在于:惩罚系数的取值如下,
其中,x表示评论浏览活跃比。
3.根据权利要求2所述的新闻客户端活跃度第三方预测方法,其特征在于:所述x由如下公式计算获得,
其中,y表示发稿浏览活跃度比。
4.根据权利要求3所述的新闻客户端活跃度第三方预测方法,其特征在于:所述评论活跃度、发稿活跃度和浏览活跃度分别由以下公式获取,
其中,C表示单篇文章评论数;D表示文章数;V表示单篇文章阅读数;j表示采样周期;Os代表原创稿件量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国搜索信息科技股份有限公司,未经中国搜索信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910433268.7/1.html,转载请声明来源钻瓜专利网。