[发明专利]一种互联网多源异质数据融合的选举预测方法在审
申请号: | 201811038860.9 | 申请日: | 2018-09-06 |
公开(公告)号: | CN109241430A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 赵忠华;吴俊杰;解峥;袁翠欣;孙小宁;李欣;万欣欣 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;北京航空航天大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q50/00 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 冀学军 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种互联网多源异质数据融合的选举预测方法,属于数据挖掘领域。首先从互联网数据中,筛选能够反映选举国家或地区民心动向的信息源。然后从筛选出的互联网信息源中提取具体特征,构建基于互联网平台的候选人支持率预测指标体系。最后将提取的各类预测指标视为反映民意的信号,运用卡尔曼滤波模型进行融合,动态实时跟踪预测候选人的支持率。本发明具有数据源广泛、实时性强等特点,在舆情监控和观点分析等领域具有重要的应用价值。 | ||
搜索关键词: | 异质数据 预测指标 多源 融合 预测 选举 筛选 互联网平台 互联网数据 互联网信息 卡尔曼滤波 动态实时 观点分析 数据挖掘 互联网 实时性 数据源 信息源 构建 监控 跟踪 应用 | ||
【主权项】:
1.一种互联网多源异质数据融合的选举预测方法,其特征在于,具体步骤如下:步骤一:从互联网数据中,筛选能够反映选举国家或地区民心动向的信息源;步骤二:从筛选出的互联网信息源中提取具体特征,构建基于互联网平台的候选人支持率预测指标体系;所述的预测指标包括:社交网络预测指标、搜索引擎预测指标和候选人竞选主页预测指标;具体构建过程如下:(一)从数量和情感两个方面构建社交网络预测指标;在数量方面,通过社交网络中提及候选人的发帖比例作为预测指标;具体而言,若第t日在社交网络平台中提及候选人i的帖子数量为
则当日该候选人i在该平台获得的提及支持率指标
计算方式如下:
或者以候选人每一日平均每条帖文获得的赞数作为网民对该候选人的支持度;具体而言,若第t日候选人i在社交网络平台发布了n条帖子,每条帖子j获得赞数为
则当日该候选人i在该平台获得的赞数支持率指标
计算方式如下:
在情感方面,对社交网络中的文本信息进行情感分类,并计算积极情感和消极情感的比例,从而作为网民对候选人的支持率预测指标;具体而言,若第t日社交网络中关于候选人i的发帖共有
条,其中积极情感帖子为
条,消极情感帖子为
条,则该候选人i的文本情感支持率指标
计算方式如下:
(二)构建搜索引擎预测指标;首先,选取选举国家或地区使用量最大的搜索引擎;然后,获取候选人i在第t日的搜索量
计算候选人i在第t日搜索引擎中的关注度指标:
(三)构建候选人竞选主页预测指标;候选人i通过竞选网站在第t日的IP访问量为
计算候选人i在t日的竞选主页关注度指标:
步骤三:将提取的各类预测指标视为反映民意的信号,运用卡尔曼滤波模型进行融合,动态实时跟踪预测候选人的支持率;具体过程如下:步骤301、运用移动平均法对提取出的各类预测指标进行平滑,得到各预测指标平滑值
当对t+1日候选人i支持率进行预测时,先计算t‑l至t日每日的各指标值
c∈{count,like,senti,search,IP},然后分别计算移动平均后的各预测指标平滑值
计算方法如下:![]()
![]()
![]()
![]()
步骤302、根据民众对候选人i在t‑1日的状态,演变计算该候选人i在第t日的真实状态值![]()
B为控制输入变量系数矩阵;ut‑1为控制输入变量;wt‑1为过程噪声向量,该噪声向量服从均值为0、协方差矩阵为Qt的多元正态分布,wt~N(0,Qt);步骤303、在每一时刻,将各预测指标平滑值
作为真实状态值
的反映;构建第t日的测量值
与真实状态值
之间的映射关系;
测量值
Ht为真实状态值到观测测量值的映射矩阵;vt为测量的高斯白噪声,服从均值为0、协方差矩阵为Rt的多元正态分布,vt~N(0,Rt);假设状态演变过程中,初始状态
过程噪声wt和测量噪声vt相互独立;步骤304、当第t日观测到测量值
后输入卡尔曼滤波模型,卡尔曼滤波根据当日候选人支持率的先验状态估计值和观测值,运用卡尔曼增益系数加权融合预测出当日的后验状态估计值![]()
![]()
表示根据前t‑1日的观测值对候选人i在第t日的支持率的估计值;Kt为卡尔曼增益系数,用以衡量先验状态估计值和测量值在融合过程中的权重;步骤305、运用卡尔曼滤波将第t日的后验状态估计值和状态转移方程进行更新,得到下一日支持率的后验状态估计值:![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;北京航空航天大学,未经国家计算机网络与信息安全管理中心;北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811038860.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种食品安全舆情监控方法及系统
- 下一篇:一种资源推荐方法和装置