[发明专利]基于微博的事件脉络获取方法和系统有效
申请号: | 201510324990.9 | 申请日: | 2015-06-12 |
公开(公告)号: | CN104933129B | 公开(公告)日: | 2019-04-30 |
发明(设计)人: | 沈剑平;莫洋;李炫;车丽美;郑楚煜;齐沁芳;宋元峰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951 |
代理公司: | 北京天健君律专利代理事务所(普通合伙) 11461 | 代理人: | 罗延红;杨艳云 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 事件 脉络 获取 方法 系统 | ||
本发明实施例提供一种基于微博的事件脉络获取方法和系统,所述方法包括:获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息;计算事件的原创微博及其转发微博的信息在统计时间段内对应的关于专题的事件热度时间分布;根据统计时间段内专题的事件热度时间分布,从统计时间段内选取多个事件脉络时间节点,及其对应的节点事件构成专题的事件脉络。本发明的技术方案实现利用微博快速、准确的获取预定专题所包含事件的事件脉络。
技术领域
本发明涉及信息处理技术,尤其涉及一种基于微博的事件脉络获取方法和系统。
背景技术
微博已经成为目前网民最为常见的一种休闲互动方式,同时微博也是一种用户了解新闻事件、传播新闻事件的有效工具,具有明显的媒体属性。相同话题所包含的事件构成的集合在新闻门户网站中一般称之为专题,一个专题通常由若干事件进展组成。譬如:“钓鱼岛争端”专题中包括“日本购岛”,“香港保钓”等若干事件。任何专题事件都包括产生、发展、高潮、结束这样一个过程,且整个过程中关键时间节点上发生的事件串联起来便形成了关于该专题进展的事件脉络。事件脉络是了解一个新闻专题事件发展的重要途径。那么,如何基于微博获取某个专题事件的事件脉络便给技术人员提出了新的挑战。
发明内容
本发明的实施例提供一种基于微博的事件脉络获取方法和系统,以利用微博快速、准确的获取预定专题所包含事件的事件脉络。
为达到上述目的,本发明的实施例提供了一种基于微博的事件脉络获取方法,包括:获取统计时间段内针对预定的专题所包含的事件的原创微博及其转发微博的信息;计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布,所述事件热度为与事件相关的原创微博及其转发微博在用户群中的关注程度;根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点,及其对应的节点事件构成所述专题的事件脉络。
进一步地,所述原创微博及其转发微博的信息包括:所述原创微博及其转发微博的评论数、转发数和点赞数。
优选地,所述计算所述事件的原创微博及其转发微博的信息在所述统计时间段内对应的关于所述专题的事件热度时间分布的处理包括:根据所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第一事件热度时间分布;所述第一事件热度为所有目标事件对应的所述事件热度的和值。
进一步地,所述根据所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数计算所述统计时间段内关于所述专题的第一事件热度时间分布的处理包括:对所述专题所包含的事件的所有原创微博及其转发微博的所述评论数、转发数和点赞数分别设置权重系数;将所述统计时间段内各时间节点对应的所述事件的所有新产生的原创微博及转发微博的所述评论数、转发数和点赞数分别与对应的权重系数相乘后,再相加的和值作为相应时间节点上所述第一事件热度;根据所述统计时间段内各时间节点对应的所述第一事件热度,形成所述第一事件热度时间分布。
进一步地,所述根据所述统计时间段内所述专题的事件热度时间分布,从所述统计时间段内选取多个事件脉络时间节点的处理包括:根据所述统计时间段内所述专题的第一事件热度时间分布,从所述统计时间段内选取多个位于所述第一事件热度时间分布中表征第一事件热度陡增的时间节点;将所述第一事件热度时间分布中表征第一事件热度陡增的时间节点中最早的时间节点确定为起始事件的脉络时间节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510324990.9/2.html,转载请声明来源钻瓜专利网。