[发明专利]众包营销微博与水军的联合检测方法及系统在审
申请号: | 201910434223.1 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110297990A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 刘波;艾莉雅;孙相国;曹玖新;倪泽阳 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/9538 | 分类号: | G06F16/9538;G06F16/951;G06F16/9536 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 徐红梅 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 先验 联合检测 关系矩阵 类别向量 转发 可视化 营销 分布式数据采集 任务调度程序 数据采集模块 用户个人属性 矩阵 异构数据库 爬虫 管理系统 回归模型 技术实现 计算模块 检测结果 强度矩阵 数据存储 数据分析 特征提取 特征向量 展示模块 多维度 鲁棒性 普适性 判定 检测 展示 开发 管理 | ||
1.众包营销微博与水军的联合检测方法,其特征在于,包括以下步骤:
(1)数据采集
爬虫模块对采集任务调度模块生成的任务进行数据采集,并结构化地将数据存储到数据存储模块;
(2)数据分析;数据分析模块对步骤(1)中的数据进行统计分析,统计的内容包括:用户的关注数量分布、用户的粉丝数量分布、用户发布微博数量分布和发布微博数量在时间上的分布;
(3)多维度特征提取与先验类别计算
多维度特征提取对步骤(1)中得到的数据进行统计分析,通过特征值标准化输出用户与微博的多维度特征向量;计算用户与微博的先验类别,将用户与微博的多维度特征向量输入二项逻辑斯蒂回归模型,使用划分好的训练集和测试集计算用户与微博的先验类别;
(4)构建联合检测模型;构建优化目标函数得到用户最有可能的身份标签以及微博最有可能的标签;
(5)检测众包水军和营销微博;
(6)系统功能展示。
2.根据权利要求1所述的众包营销微博与水军的联合检测方法,其特征在于,步骤(1)中使用爬虫从国内知名的众包网站页面以及新浪微博网站分别获取众包任务数据与用户和微博数据,并结合内存数据库进行分布式数据采集,获得营销微博、众包水军、及相关用户、关注关系、微博及评论内容信息。
3.根据权利要求1所述的众包营销微博与水军的联合检测方法,其特征在于,步骤(2)中从种子节点开始,通过关注列表采集用户作为目标用户,对采集到的用户关注数量、粉丝数量、发布微博数量取对数,与某一关注数量下统计得到的用户数量取对数,获得的双对数图满足幂律分布。
4.根据权利要求1所述的众包营销微博与水军的联合检测方法,其特征在于,步骤(3)中用户个人属性维度通过计算用户注册时间特征获得,记用户u从注册日期开始到某天的天数差为lifetime(u),则用户注册时间特征定义为:
关注行为属性维度通过用户与粉丝的关注关系获得,记用户u的关注数为followee(u),粉丝数为follower(u),则用户关注数量特征与粉丝数量特征定义为:
通过计算双向关注率特征得到关注行为属性,双向关注率特征定义为:
其中,e(u)为用户u的关注边数量,则为其中双向关注边数量;
转发行为属性维度包括第三方软件使用频率特征、关注转发率特征、一跳转发率特征;
定义用户u发布的微博总数为wblog(u),其中经由第三方应用发布的微博数为wblogThi(u),则第三方应用使用频率特征表示为:
令re(u)为某一用户转发的微博总数,refo(u)为该用户转发其关注者的微博的数量,则关注转发率特征定义为:
定义转发原创微博的行为为一跳转发行为,令re(u)为某一用户转发的微博总数,onehop(u)为该用户一跳转发的微博的数量,则一跳转发率特征形式化表示为:
定义微博的评论文本相似度特征
其中,C表示给定微博的评论集合,cosine(ckcl)则表示评论ck与cl之间的文本余弦相似度;
定义评论情感特征为:
其中,表示给定微博所有评论的情感极性的标准差,表示评论ck的情感极性,取值范围为0~1,其中0代表绝对消极,1代表绝对积极,使用开源中文自然语言处理库snowNLP获得;
定义reply(m)表示微博m的评论中与其他人互动的评论的条数,like(m)为评论中的点赞数量,则评论互动特征与评论点赞行为特征为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910434223.1/1.html,转载请声明来源钻瓜专利网。