[发明专利]用于微博水军识别的方法与设备在审
申请号: | 201910900124.8 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110727861A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 翟光景;田进太;赵庆平;刘益东 | 申请(专利权)人: | 上海蜜度信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 31243 上海百一领御专利代理事务所(普通合伙) | 代理人: | 王奎宇;甘章乖 |
地址: | 201800 上海市嘉定*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 维度属性 活动信息 输出结果 信息确定 信息输入 预设 申请 改造 网络 | ||
本申请的目的是提供一种用于微博水军识别的方法与设备。与现有技术相比,本申请通过获取待识别的微博用户的N个维度属性信息,其中,所述维度属性信息包括微博用户在微博的相关活动信息,其中,N为大于1的预设值;将所述N个维度属性信息输入已训练的改造过的DNN网络;获取所述改造过的DNN网络基于所述N个维度属性信息确定的、对应微博用户是否为微博水军的输出结果。通过这种方式,能够准确高效地识别出微博水军。
技术领域
本申请涉及计算机技术领域,尤其涉及一种用于微博水军识别的技术。
背景技术
目前微博疑似水军的计算分为基于规则和传统机器学习的模式。基于规则的识别方式简单但是水军伪装方式一直在变,因此基于规则疲于应付。基于传统机器学习的方式避免了基于规则的一些缺点,但是准确性不是很高。
发明内容
本申请的目的是提供一种用于微博水军识别的方法与设备。
根据本申请的一个方面,提供了一种用于微博水军识别的方法,其中,该方法包括:
获取待识别的微博用户的N个维度属性信息,其中,所述维度属性信息包括微博用户在微博的相关活动信息,其中,N为大于1的预设值;
将所述N个维度属性信息输入已训练的改造过的DNN网络;
获取所述改造过的DNN网络基于所述N个维度属性信息确定的、对应微博用户是否为微博水军的输出结果。
进一步地,其中,在所述获取待识别的微博用户的N个维度属性信息之前,所述方法还包括:
获取待识别的微博用户的筛选信息;
基于对所述筛选信息的预设规则,对所述待识别的微博用户进行筛选;
其中,所述获取待识别的微博用户的N个维度属性信息包括:
获取筛选后的待识别的微博用户的N个维度属性信息。
进一步地,其中,所述筛选信息包括以下至少任一项:微博用户的身份认证类型;微博用户的粉丝数。
进一步地,其中,所述方法还包括训练改造过的DNN网络,其中,所述训练改造过的DNN网络包括:
获取已标注微博水军的微博用户的N个维度属性信息;
将所述已标注微博水军的微博用户的N个维度属性信息输入改造过的DNN网络进行训练,直至计算出的损失值满足预设的损失阈值。
进一步地,其中,所述改造过的DNN网络包括:输入层、隐藏层、输出层以及softmax层,其中,输入层由N个神经元组成,对应N个维度属性信息,作为输入向量;隐藏层有两层,每层的神经元个数设定为2N+1个;输出层由2个神经元组成;softmax层用来确定是否为微博水军的最终计算。
进一步地,其中,所述N个维度属性信息包括:单位周时间微博原创数量、单位周时间转发量、粉丝数、单条微博的平均被转发评论、关注他人数、收藏数量、点赞数。
根据本申请的另一方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如前述方法的操作。
根据本申请的再一方面,还提供了一种用于微博水军识别的设备,其中,该设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器:获取待识别的微博用户的N个维度属性信息,其中,所述维度属性信息包括微博用户在微博的相关活动信息,其中,N为大于1的预设值;将所述N个维度属性信息输入已训练的改造过的DNN网络;获取所述改造过的DNN网络基于所述N个维度属性信息确定的、对应微博用户是否为微博水军的输出结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蜜度信息技术有限公司,未经上海蜜度信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910900124.8/2.html,转载请声明来源钻瓜专利网。