[发明专利]一种互联网多源异质数据融合的选举预测方法在审
申请号: | 201811038860.9 | 申请日: | 2018-09-06 |
公开(公告)号: | CN109241430A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 赵忠华;吴俊杰;解峥;袁翠欣;孙小宁;李欣;万欣欣 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;北京航空航天大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q50/00 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 冀学军 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异质数据 预测指标 多源 融合 预测 选举 筛选 互联网平台 互联网数据 互联网信息 卡尔曼滤波 动态实时 观点分析 数据挖掘 互联网 实时性 数据源 信息源 构建 监控 跟踪 应用 | ||
本发明公开了一种互联网多源异质数据融合的选举预测方法,属于数据挖掘领域。首先从互联网数据中,筛选能够反映选举国家或地区民心动向的信息源。然后从筛选出的互联网信息源中提取具体特征,构建基于互联网平台的候选人支持率预测指标体系。最后将提取的各类预测指标视为反映民意的信号,运用卡尔曼滤波模型进行融合,动态实时跟踪预测候选人的支持率。本发明具有数据源广泛、实时性强等特点,在舆情监控和观点分析等领域具有重要的应用价值。
技术领域
本发明属于数据挖掘领域,涉及一种互联网多源异质数据融合的选举预测方法。
背景技术
选举制度设立至今已有百余年的历史,对于大选结果的预测备受社会各界关注,涌现出了多类预测方法和技术。
最初的选举预测依赖民意调查,调查机构一般来自调查组织、各大主流媒体以及大学的研究机构,他们往往基于采样调查理论进行信息收集,辅以专家的意见修正,以民意测验测评政治风向进而得到预测结果。这种基于民调的预测方法优点是:实时性较强,临近选举对民意造成影响的新信息可以包含在结果中。但是,由于调查方法、样本大小以及民调机构政党倾向性等因素的影响,民调结果往往有偏。
后续,有部分学者和公司机构提出了基于宏观变量的预测方法。这类预测方法综合考虑国家层面宏观经济数据,构建预测模型对大选得票率进行预测。该类方法预测模型易得,对选举结果具有较强的解释性。但预测模型往往基于长期历史数据,时效性不强,无法在模型中引入临近选举的最新信息;且在候选人难分伯仲的情况下,很难做出准确预测。
随着互联网技术的迅速发展,信息呈爆炸式增长,选举信息呈现方式也越来越多样化,大数据中蕴含的丰富信息给选举预测带来了新的解决思路。多个国家或地区的选举都证明了诸如Facebook和Twitter等社交网络在得票率预测中的作用。基于互联网大数据的选举预测方法相较于民调方法和基于宏观变量的预测方法具有更强的实时性,但目前方法多属于事后分析,且仅基于单一社交媒体数据源,没有考虑到用户参与社交媒体平台的多样性。如此,得到的候选人支持率预测结果往往有较大的偏差,难以全面反映选举舆情。
发明内容
为解决上述问题,本发明提出了一种获取选举得票率的预测方法,具体是一种互联网多源异质数据融合的选举预测方法;以参选人支持率为预测对象,通过融合社交媒体、搜索引擎和竞选主页等多源异构大数据,克服单一数据源在揭示民意方面的偏差,以实现实时跟踪以及预测候选人支持率的目标。
所述的互联网多源异质数据融合的选举预测方法,具体步骤如下:
步骤一:从互联网数据中,筛选能够反映选举国家或地区民心动向的信息源。
筛选信息源的步骤具体为:
首先,针对选举国家或地区,查找该国家或地区的互联网管理和服务机构发布的研究报告,从报告中提取出网民广泛使用的互联网平台。
然后,通过对互联网平台的网站进行流量统计,得到该选举国家或地区的网站使用排名,筛选出使用最为频繁的网站。
最后,从使用最为频繁的网站中,保留社交网络类和搜索引擎类等带有用户生成内容的信息源。同时,在候选信息源中加入候选人竞选主页,进而通过流量统计网站,分析民众对于不同候选人竞选网站的关注程度。
步骤二:从筛选出的互联网信息源中提取具体特征,构建基于互联网平台的候选人支持率预测指标体系。
所述的预测指标包括:社交网络预测指标、搜索引擎预测指标和候选人竞选主页预测指标。具体构建过程如下:
(一)从数量和情感两个方面构建社交网络预测指标;
在数量方面,通过社交网络中提及候选人的发帖比例作为预测指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;北京航空航天大学,未经国家计算机网络与信息安全管理中心;北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811038860.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食品安全舆情监控方法及系统
- 下一篇:一种资源推荐方法和装置