[发明专利]众包营销微博与水军的联合检测方法及系统在审
申请号: | 201910434223.1 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110297990A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 刘波;艾莉雅;孙相国;曹玖新;倪泽阳 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/9538 | 分类号: | G06F16/9538;G06F16/951;G06F16/9536 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 徐红梅 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了众包营销微博与水军的联合检测方法及系统,在数据采集模块,使用多种异构数据库管理系统作为数据存储与管理后端,通过开发爬虫与任务调度程序实现具有普适性的分布式数据采集任务;在特征提取与先验类别计算模块,提取用户个人属性与用户微博关注转发等属性,形成多维度特征向量,利用二项逻辑斯蒂回归模型计算用户与微博的先验类别向量计算用户、微博间联系强度与转发关系,得到关注关系矩阵、联系强度矩阵与转发关系矩阵;最后将先验类别向量与三种矩阵带入联合检测模型,对营销微博与水军进行判定,在可视化展示模块,系统采用web交互技术实现检测结果和数据分析的可视化展示。本发明可以有效提高检测的准确性,鲁棒性强。 | ||
搜索关键词: | 微博 先验 联合检测 关系矩阵 类别向量 转发 可视化 营销 分布式数据采集 任务调度程序 数据采集模块 用户个人属性 矩阵 异构数据库 爬虫 管理系统 回归模型 技术实现 计算模块 检测结果 强度矩阵 数据存储 数据分析 特征提取 特征向量 展示模块 多维度 鲁棒性 普适性 判定 检测 展示 开发 管理 | ||
【主权项】:
1.众包营销微博与水军的联合检测方法,其特征在于,包括以下步骤:(1)数据采集爬虫模块对采集任务调度模块生成的任务进行数据采集,并结构化地将数据存储到数据存储模块;(2)数据分析;数据分析模块对步骤(1)中的数据进行统计分析,统计的内容包括:用户的关注数量分布、用户的粉丝数量分布、用户发布微博数量分布和发布微博数量在时间上的分布;(3)多维度特征提取与先验类别计算多维度特征提取对步骤(1)中得到的数据进行统计分析,通过特征值标准化输出用户与微博的多维度特征向量;计算用户与微博的先验类别,将用户与微博的多维度特征向量输入二项逻辑斯蒂回归模型,使用划分好的训练集和测试集计算用户与微博的先验类别;(4)构建联合检测模型;构建优化目标函数得到用户最有可能的身份标签以及微博最有可能的标签;(5)检测众包水军和营销微博;(6)系统功能展示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910434223.1/,转载请声明来源钻瓜专利网。