[发明专利]网络社会事件的协同关联跟踪及全局态势分析与预测系统在审
申请号: | 201310197129.1 | 申请日: | 2013-05-24 |
公开(公告)号: | CN103455705A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 徐常胜;张天柱 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 梁爱荣 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 社会 事件 协同 关联 跟踪 全局 态势 分析 预测 系统 | ||
技术领域
本发明属于网络社会事件的关联跟踪与预测技术领域,涉及一种关于网络社会事件的协同关联跟踪及全局态势分析与预测框架体系。
背景技术
随着互联网的快速普及,网络已经成为大多数人生活中不可或缺的工具。网民数量正在快速的增长,逐渐成为一个庞大的群体,根据中国互联网络发展状况统计报告显示,截至2012年12月底,中国网页数量为1227亿个,比2011年同期增长41.7%。以上统计数据表明,我们已经生活在海量的网络数据中。我们不仅需要对这些网络数据进行合理的存储,并且还需要研究怎么处理网络中海量的数据,从而得到其隐藏在海量网络数据后的潜在有用信息。面对互联网上的海量文本,图像,视频数据,如何对社会热点事件产生的大规模数据进行有效地组织、获取、挖掘与监控已成为一项迫切的应用需求。
一个新闻热点事件是随着时间不断发展变化的,随着事件的发展,有新的重要的新闻故事发生,有旧的故事消亡。当用户搜索这个新闻事件时,一个重要的任务就是发现新闻话题,找出各个新闻故事之间的相关性,并以此构建一个事件发展的过程图,将这个事件主题的发展脉络建立起来。因此,在搜索一个热点事件时,用户希望看到的搜索结果并不是仅根据文本相关性排列的一系列新闻条目,让用户在一堆杂乱无章的新闻条目中去寻找事件各个故事之间的关系和事件的进展,而应是能根据事件的发展将事件演化的关系、事件的发展、事件主题的演化过程等信息,以一种清晰的、图形化的界面展示给用户,让用户能够快速知道整个事件的发展演变过程,并且让用户快速了解和分析这个事件的主题。如何迅速、准确、适量地提供用户所需信息,并在一定程度上揭示信息之间的关联,把一个热点事件的完整演变过程呈现给用户,为用户提供智能的信息检索服务,并且让用户快速了解和分析这个事件的主题,已成为学术界和工业界共同关心的课题。
由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点,当一个热点事件发生时,越来越多的网民愿意通过网络渠道来表达自己的观点。当今,信息传播与意见交互空前迅捷,网络舆论的表达诉求也日益多元。如果不能有效地进行引导,负面的网络舆情将对社会公共安全形成较大的威胁。纵观国际大环境和我国的国情,网络安全、社会稳定以及对热点事件的监管都面临着重大的挑战。中东地区的茉莉花革命在各个国家的迅速蔓延和网络信息的传播互动,以及我国近期出现的“江苏启东728事件”、“中日钓鱼岛之争”等一系列牵动亿万网友的热点事件在网络上迅速的传播以及网友广泛的参与,无不说明了我们所面临的社会事件分析形势极其严峻。我国正处于全面建设小康与和谐社会的关键时期,特别需要一个安全稳定的政治和社会环境,因此政府及相关管理者亟需对于网络上舆论信息进行有效地挖掘、分析与处理,把握处理危机事件的最佳时机。然而,仅仅依靠人工方式难以应对海量的网络信息的搜集和处理,需要融合多种信息技术,通过适当的计算机技术,分析当前的社会热点事件与突发事件,对网络中负面的舆情和误导性言论及时、迅速做出反应,挖掘网络中形成事件各个过程的缘由,将谣言和危机扼杀于无形,从而提高对热点事件和突发事件的监管和处理能力。
现有的社会事件的跟踪和预测算法只是使用了单个平台的文本信息。还在文本信息理解上,聚类技术是数据挖掘以及模式识别的基本技术,通过对文本信息进行聚类来得到社会事件的主题,传统的聚类方法对于社会事件的爆发性和区域性等特性,其主题挖掘精确度不高,很难对一个完整事件进行其语义描述。因为除了文本信息,事件也有其丰富的视觉信息。对一个事件来说,其在不同的网站会有不同的用户评论,然而,这两个网站可能有非常相似的视觉信息,比如,图像或者视频,这些信息为跨时间跨网站构建一个事件条目演变的桥梁是非常有用的。例如,事件“2012年美国总统大选”,这个事件的各个条目关于奥巴马的图像是很大地关联的。因此,采用多模态信息融合更能正确地对社会事件进行描述。并且,不同的平台也能够互相弥补和增强。例如,大部分事件在Google News上是来自于官方媒体,但是他们在Flickr上也有许多用户评论。因此,信息在不同的平台上能够互相帮助,尤其是在一个平台中的优势来补充另一个平台中的弱势更为有效。关键的挑战是如何来找到最有效的方法来构建两个平台之间的语义鸿沟。针对这种情况,如果能够把视觉信息融入,对社会事件建立一个统一的多模态信息描述,并且在不同平台上对社会事件进行有效地协同关联,从而实现跨平台的多模态信息融合的事件语义描述体系。基于跨平台多媒体信息的社会事件协同跟踪及全局态势分析与预测方法能够把多平台的多模态信息有效地结合起来,从而改善这一不足。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310197129.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:挡圈压装装置
- 下一篇:一种确定区域电离层延迟的方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用