[发明专利]网络文章传播力评估方法及装置有效
申请号: | 201711407394.2 | 申请日: | 2017-12-22 |
公开(公告)号: | CN107967364B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 吴新丽;姚笛;赵立永;李云飞;王文文 | 申请(专利权)人: | 新华网股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/9532;G06K9/62 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 100062 北京市大兴区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 文章 传播 评估 方法 装置 | ||
本发明公开了一种网络文章传播力评估方法及装置,该网络文章传播力评估方法,包括:提取待处理网络文章的特征参数;并根据所述特征参数计算所述待处理网络文章的影响力权重值;根据所述影响力权重值确定目标网络文章的传播力指数。本发明中,根据提取的待处理网络文章的特征参数来计算该待处理网络文章的影响力权重值,进而根据该影响力权重值来确定目标网络文章的传播力指数。实现了对网络文章传播力的有效评估。
技术领域
本发明涉及互联网技术领域,特别是涉及一种网络文章传播力评估方法及装置。
背景技术
目前针对一些互联网应用的相关分析基本都集中在其公众号的影响力分析方面。针对单篇原创文章的传播情况,仅仅以统计该篇文章的阅读数和点赞数为主,但在实际情况中,存在大量公众号转载其他公众号所发文章内容的现象,这些转载的行为都应该纳入该文章整体传播力的范畴。
对于该互联网应用,其官方首次确认其活跃用户数超过9亿,公众号数量超过2000万,活跃公众号数量已经超过350万个。这些公众号每天发布的文章数量高达数百万篇。针对这些文章在该应用中的整体传播情况,目前的方式为通过该应用公众平台后台查看指定账号下文章的阅读人数(阅读数)、转发次数(转发数)来了解文章的传播情况。当前主流的微博传播力计算为清博指数和微指数。二者均以阅读数和点赞数为衡量依据。但在实际情况中,存在大量的原创文章内容被其他公众号转发但并未关联转发来源或者即使标明了来源却存在不可回溯的问题,而这些都应该纳入到该指定原创文章传播力的评估范畴。如何实现客观全面的评估网络文章的传播力,对于改进和提升公众号运营策略、保护原创知识产权等均具有重要的意义。
其中,清博指数的应用传播指数WCI以公众号为单位进行分析,具体包括四个分析指标,分别为整体传播力、篇均传播力、头条传播力和峰值传播力。所有的计算均以文章的阅读数和点赞数为依据,具体如图1所示。
其中针对文章的传播力是计算该应用公众号下所发文章的平均传播力,计算依据是篇均阅读数和篇均点赞数。而对于如何确定每篇文章各自的传播力的方式是当前亟待解决的技术问题。
发明内容
本发明提供网络文章传播力评估方法及装置,以实现对网络文章传播力的有效评估。
本发明提供了一种网络文章传播力评估方法,包括:
提取待处理网络文章的特征参数;
并根据所述特征参数计算所述待处理网络文章的影响力权重值;
根据所述影响力权重值确定目标网络文章的传播力指数。
优选地,所述提取待处理网络文章的特征参数,包括:
根据目标网络文章确定其所对应的待处理网络文章,并获取所述待处理网络文章的索引信息;
根据所述索引信息查找预先建立的消息队列;
获取所述消息队列中对应所述索引信息的特征参数。
优选地,所述根据所述特征参数计算所述待处理网络文章的影响力权重值,包括:
根据所述待处理网络文章的特征参数计算所述待处理网络文章的待处理相似度值;
根据预设的目标网络文章的目标相似度值与所述待处理相似度值进行比较,并根据比较结果对所述待处理网络文章进行集合分配;
根据所述特征参数计算所述待处理网络文章在所属集合中的影响力权重值。
优选地,所述特征参数包括正文内容,所述根据所述待处理网络文章的特征参数计算相似度,得到待处理相似度值,包括:
对所述正文内容进行分词、去噪处理,得到特征词;
根据特征词的权重得到特征词集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华网股份有限公司,未经新华网股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711407394.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、装置及电子设备
- 下一篇:一种专利检索方法