[发明专利]社交网络突发事件的多维度评估方法有效
申请号: | 201510061737.9 | 申请日: | 2015-02-05 |
公开(公告)号: | CN104615717B | 公开(公告)日: | 2018-03-09 |
发明(设计)人: | 张日崇;于伟仁;胡春明;卢忠宇;李雪 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 北京同立钧成知识产权代理有限公司11205 | 代理人: | 马爽,黄健 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 突发事件 多维 评估 方法 | ||
技术领域
本发明属于大数据处理技术领域,尤其是涉及一种社交网络突发事件的多维度评估方法。
背景技术
社交网络在人们的生活中扮演着越来越重要的角色,比如微博,国内最大的两大微博平台新浪和腾讯的注册人数早已超过5亿。CNNIC第33次中国互联网络发展状况调查统计报告截至2013年12月,我国微博用户规模为2.81亿,网民中微博使用率为45.5%。
对于突发事件或者说热点事件来说,微博的影响规模和传播速度超越了普通博客和传统的新闻媒体。2008年5月12日,中国四川汶川发生大地震,Twitter在约14时35分33秒披露首条消息。包括临武瓜农事件、校车超载事故,以及2014年4月起在全国产生巨大影响的“幼童香港小便事件”也是通过微博平台在社会人群中迅速传播,进而引起广泛讨论,微博已经成为不可小觑的舆论平台。
微博能够及时反映舆论情况,及时地从微博获取实时信息,判断突发事件,找到相关微博具有重大的意义。目前从大量微博中检测突发事件的方式多种多样,比如采用基于聚类的方法、采用主题模型的方法等来实现突发事件的检测。并在检测得到社交网络中的突发事件后,由于每个突发事件由多个关键词组成,从而可以将检测得到的突发事件以其包含的关键词集合的形式进行呈现,以使用户获知检测到的各个突发事件。
上述方案中,尤其是在检测得到多个突发事件时,将多个突发事件分别以其包含的关键词集合的形式进行无差异化评估,仅简单地呈现出各突发事件包含的关键词集合,使得用户无法及时获知当前最热点的事件或者每个事件的主题,造成较差用户体验。
发明内容
针对上述存在的问题,本发明提供一种社交网络突发事件的多维度评估方法,用以实现差异化地评估社交网络中检测得到的各突发事件,以提高用户体验的目的。
本发明提供了一种社交网络突发事件的多维度评估方法,包括:
获取突发热词共现图;其中,所述突发热词共现图的节点集包括各突发热词节点以及分别与每个突发热词节点存在共现关系的各共现词节点,所述突发热词共现图的边集包括所述各突发热词节点与所述各突发热词节点分别对应的共现词节点间的边;其中,所述突发热词共现图为对关键词共现图进行突发热词检测后得到的,所述关键词共现图根据所述社交网络中的待处理数据文本中包含的共现关键词得到,所述共现关键词是指同时出现在同一个数据文本中的关键词;
对所述突发热词共现图进行预设图聚类算法处理,得到各个聚类结果,每个聚类结果中包含的关键词节点构成一个突发事件,所述关键词节点包括所述突发热词节点和所述共现词节点;
分别计算每个突发事件中的各关键词节点的预设度量指标的值,根据所述预设度量指标的值确定所述每个突发事件的重要性度量值;
根据所述每个突发事件的重要性度量值差异化呈现所述每个突发事件。
本发明提供的社交网络突发事件的多维度评估方法,在获得包含有各待处理数据文本中的突发热词以及与各突发热词分别共现连接的各共现词的热词共现图之后,基于该热词共现图进行突发事件检测,以得到各突发事件。对于每个突发事件,根据其包含的关键词集合中的各关键词的预设指标的指标值得到其重要性度量值,从而根据反映了各突发事件不同重要程度的多维重要性度量值来确定各突发事件的差异化表现形式。通过该差异化评估,使得用户能够直观、明显便捷地获知当前社交网络中最为重要的事件。
附图说明
图1为本发明社交网络突发事件的多维度评估方法实施例一的流程图;
图2为本发明社交网络突发事件的多维度评估方法实施例二的流程图;
图3为实施例二中关键词共现图的示意图;
图4为实施例二中突发热词共现图的示意图。
具体实施方式
图1为本发明社交网络突发事件的多维度评估方法实施例一的流程图,如图1所示,该方法包括:
步骤101、获取突发热词共现图;
其中,所述突发热词共现图Gk(t)的节点集包括各突发热词节点以及分别与每个突发热词节点存在共现关系的各共现词节点,所述突发热词共现图的边集包括所述各突发热词节点与所述各突发热词节点分别对应的共现词节点间的边;其中,所述突发热词共现图为对关键词共现图进行突发热词检测后得到的,所述关键词共现图根据所述社交网络中的待处理数据文本中包含的共现关键词得到,所述共现关键词是指同时出现在同一个数据文本中的关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510061737.9/2.html,转载请声明来源钻瓜专利网。