[发明专利]基于最优模型的WEB舆情趋势预测方法无效
申请号: | 200910167640.0 | 申请日: | 2009-09-15 |
公开(公告)号: | CN101826090A | 公开(公告)日: | 2010-09-08 |
发明(设计)人: | 高辉;傅彦;王沙沙 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 最优 模型 web 舆情 趋势 预测 方法 | ||
技术领域
本发明涉及智能信息预测技术,更具体地,涉及一种互联网舆情发展趋势的预测技术。
背景技术
网络舆情
随着互联网的快速发展,网络媒体作为一种新的信息传播形式已经深入人们的日常生活,公众在网络上的言论活跃程度也达到前所未有的地步。不论是国内还是国际重大事件,都能马上在网络上传播开来并引起公众的极大关注和热烈讨论进而产生巨大的舆论压力,达到任何部门和机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。
网络舆情是通过互联网传播的公众对现实生活中某些热点、焦点问题所持有的具有较强影响力和明显倾向性的言论和观点,主要通过BBS论坛、博客、新闻跟贴、转贴等实现并加以强化。当今社会,信息传播与意见交互空前迅捷,网络舆论的表达诉求也日益多元,如果引导不善,负面的网络舆情将对社会公共安全形成较大威胁。对相关政府部门来说,如何加强对网络舆论的及时监测和有效引导,如何提前预测网络舆情的发展趋势以积极化解网络舆论危机,对维护社会稳定和促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。
现有预测技术
预测技术可分为两类:①数量分析,即基于统计资料并借助数学工具来分析因果关系以进行预测。数量分析预测具体方法很多,如趋向外推法和回归分析法等。趋向外推法即时间序列分析法,它是根据历史和现有的资料推测发展趋势,从而分析出事物未来的发展情况的,所谓的时间序列即把在一定条件下出现的事件按时间顺序加以排列,并且通过趋势外推的数学模型预测未来;回归分析法也称相关分析即从事物变化的因果关系出发来进行预测,研究引起未来变化的各种客观因素的相互作用、指出各种客观因素与未来状态之间统计关系的方法。②定性判断,即在没有较充分的数据可利用时,只能凭借直观材料依靠个人经验和分析能力来进行逻辑判断并对未来做出预测。
预测方法有四种基本的类型:定性预测、时间序列分析、因果联系法和模拟。
(1)定性预测:它是基于估计和评价的因此属于主观判断,常见的定性预测方法包括:一般预测、市场调研法、小组讨论法、历史类比、德尔菲法等。
(2)时间序列分析法:它是建立在与过去需求相关的历史数据可用于预测未来的需求这样一个设定基础上的。历史数据可能包含诸如趋势、季节、周期等因素,常见的时间序列分析方法主要有:简单移动平均、加权移动平均、指数平滑、回归分析、鲍克斯·詹金斯法、西斯金时间序列等。该方法简单易行,便于掌握,虽然在现实中得到了广泛的应用,但其准确性差,一般只适用于短期预测。
(3)因果联系法:它是建立在需求与某些内在因素或周围环境的外部因素有关的这样一个设定基础上的,常见的因果联系法主要有:回归分析、经济模型、投入产出模型、行指标等。
(4)模型:模拟模型允许预测人员对预测的条件作一定程度的假设。
技术问题
目前各个领域的预测均采用以上所述的现有预测技术进行预测,这些预测技术在进行短期预测时具有一定的效果,适合给有关机构提供分析和参考。但是当采用这些预测技术进行长期预测时,随着时间的推移不确定性因素的增加使得预测结果的偏差很大,并且无法及时提早的发现趋势发展的拐点,从而导致政府和监管部门无法采取及时有效地预防措施去更好的实现网络监管的功效。所以如何准确的发现拐点并对事件的发展做出长期趋势预测成为一个亟待解决的问题。
发明内容
本发明的目的在于克服上述现有预测方法的不足,提供一种可以比较准确的发现拐点并对事件的发展做出长期趋势预测的方法。
为实现上述目的,本发明包括以下步骤:
(1)、分析指定论坛的URL特征抓取网页,将信息文档和相关的数据信息保存到本地数据库;
(2)、对本地数据库中的信息文档进行聚类和分类,获得各类文档数据库;
(3)、从各类文档已有的数据库中,根据事件标记和时间标记获取每个事件所需参数(如单位时间的文档量等)的时间序列,或从Google trends网站上下载每个事件对应的Google趋势时间序列;
(4)、针对步骤(3)中所获得的各类事件的时间序列,建立相应的最优模型并保存,作为被预测对象趋势匹配的对象;
(5)、当新的舆情事件发生时,首先通过步骤(1)到步骤(3)获得该事件相应的一些时间序列和所属的大类。通过与其所属大类里的已训练得到的一些最优模型进行匹配,从而实现对新舆情的长期预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910167640.0/2.html,转载请声明来源钻瓜专利网。