[发明专利]基于新闻评论的网络水军识别方法和装置在审

专利信息
申请号: 202010009216.X 申请日: 2020-01-06
公开(公告)号: CN111191037A 公开(公告)日: 2020-05-22
发明(设计)人: 代继涛;赵立永;吴新丽;韩勇;李丹;刘启明 申请(专利权)人: 新华网股份有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/383;G06F40/279;G06K9/62
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 戎郑华
地址: 100162 北京市大兴区北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 新闻 评论 网络 水军 识别 方法 装置
【说明书】:

本申请提出一种基于新闻评论的网络水军识别方法和装置,其中,方法包括:获取第一用户针对预设新闻事件发布的目标评论集,其中,目标评论集中包括多条评论及每条评论的发布时间;根据目标评论集中各条评论间的相似性,确定第一用户对应的第一文本相似度特征;根据预设新闻事件对应的参考时间窗口及第一用户的每条评论的发布时间,确定第一用户对应的信息熵特征;利用预设的模型,对第一用户对应的第一文本相似度特征及信息熵特征进行编码、解码处理,确定第一用户为水军的概率值。该方法通过提取用户发布的评论文本相似性特征,和可指示用户发布评论规律的信息熵特征,利用预设的模型对提取的特征进行处理,实现识别新闻评论中的水军。

技术领域

本申请涉及大数据处理技术领域,尤其涉及一种基于新闻评论的网络水军识别方法和装置。

背景技术

网络水军为一群在网络中针对特定内容发布特定信息的、被雇佣的网络写手。网络水军通常简称水军,又名网络枪手,他们通常活跃在电子商务网站、论坛、微博等社交网络平台中。他们通过伪装成普通网民或消费者,通过发布、回复和传播博文等对正常用户产生影响。

传统网络水军识别的最早研究主要集中在电子邮件领域,也是相对成熟的领域。随着电子商务与社交网络的发展,在电子商务和社交网络上也出现了大量以混淆人们视野的网络水军,针对电子商务和社交网络的特点也出现了大量的网络水军的识别方法。

但在新闻领域中,由于新闻具有时效性、水军间无明显的社交关系等特征,从而采用上述领域的水军识别方法,不能识别新闻评论领域的水军。

发明内容

本申请提出一种基于新闻评论的网络水军识别方法和装置,用于解决现有技术中对产品、电子邮件、社交领域进行水军识别的方法,不能识别新闻评论领域的水军的问题。

本申请一方面实施例提出了一种基于新闻评论的网络水军识别方法,包括:

获取第一用户针对预设新闻事件发布的目标评论集,其中,目标评论集中包括多条评论及每条评论的发布时间;

根据所述目标评论集中各条评论间的相似性,确定所述第一用户对应的第一文本相似度特征;

根据所述预设新闻事件对应的参考时间窗口及所述第一用户的每条评论的发布时间,确定所述第一用户对应的信息熵特征;

利用预设的模型,对所述第一用户对应的第一文本相似度特征及信息熵特征进行编码、解码处理,确定所述第一用户为水军的概率值。

本申请实施例的基于新闻评论的网络水军识别方法,通过首先获取第一用户针对预设新闻事件发布的目标评论集,其中,目标评论集中包括多条评论及每条评论的发布时间,然后根据目标评论集中各条评论间的相似性,确定第一用户对应的第一文本相似度特征,根据预设新闻事件对应的参考时间窗口及第一用户的每条评论的发布时间,确定第一用户对应的信息熵特征,之后利用预设的模型,对第一用户对应的第一文本相似度特征及信息熵特征进行编码、解码处理,确定第一用户为水军的概率值。由此,通过提取用户发布的评论文本相似性特征,和可指示用户发布评论规律的信息熵特征,利用预设的模型对提取的特征进行处理,实现识别新闻评论中的水军。

本申请另一方面实施例提出了一种基于新闻评论的网络水军识别装置,包括:

第一获取模块,用于获取第一用户针对预设新闻事件发布的目标评论集,其中,目标评论集中包括多条评论及每条评论的发布时间;

第一确定模块,用于根据所述目标评论集中各条评论间的相似性,确定所述第一用户对应的第一文本相似度特征;

第二确定模块,用于根据所述预设新闻事件对应的参考时间窗口及所述第一用户的每条评论的发布时间,确定所述第一用户对应的信息熵特征;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华网股份有限公司,未经新华网股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010009216.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top