[发明专利]新闻事件信息归纳方法有效

专利信息
申请号: 201910207437.5 申请日: 2019-03-19
公开(公告)号: CN109960756B 公开(公告)日: 2021-04-09
发明(设计)人: 张旭;刘春阳;石瑾;张翔宇;李建欣;闫昊;邰振赢 申请(专利权)人: 国家计算机网络与信息安全管理中心;北京航空航天大学
主分类号: G06F16/953 分类号: G06F16/953;G06F16/34;G06F16/35;G06F40/211
代理公司: 北京远大卓悦知识产权代理有限公司 11369 代理人: 史霞
地址: 100029*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 新闻 事件 信息 归纳 方法
【说明书】:

发明公开了一种新闻事件信息归纳方法,包括:收集新闻素材,创建新闻库;从新闻库中获取目标事件的所有新闻文本,并进行热度分析,获取拐点新闻文本,抽取所述拐点新闻文本中的事件信息并保存;其中,获取拐点新闻文本的方法包括:统计所有新闻文本的热度值,按照新闻文本发布的时间顺序排序,构建热度值随时间变化的曲线图,取曲线图的所有极大点对应的新闻文本,即为所述拐点新闻文本,所述热度值为新闻的页面浏览量和网站独立访客量之和。本发明的方法通过选择对于目标新闻事件处于关键节点时的新闻文本——即拐点新闻文本进行摘要分析处理,准确地反映了新闻事件的发展态势。

技术领域

本发明涉及信息抽取领域,具体是新闻事件信息归纳方法。

背景技术

近几年来,随着计算机和信息技术的迅猛发展和普及应用,人们越来越依赖互联网获取关于目标新闻事件信息的收集。以往的信息抽取系统虽然可以在一定程度上帮助用户检索到大量的目标信息,但是由于身处信息量爆炸的时代所带来的桎梏,使得用户常常直接检索到的是大量的围绕目标事件的相关信息,用户还需要进一步从中筛选,才能得到有用信息;此外,事件是随着时间的变化而处于动态的发展中的,现有的信息抽取系统在搜索目标事件时,很难将关于事件的发展趋势呈现出来,这难免给用户分析目标事件的进程又带来了诸多困扰。

发明内容

本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。

本发明还有一个目的是提供一种新闻事件信息归纳方法。本发明通过选择对于目标新闻事件处于关键节点时的新闻文本——即拐点新闻文本进行摘要分析处理,准确地反映了新闻事件的发展态势。

为了实现根据本发明的这些目的和其它优点,提供了一种新闻事件信息归纳方法,其特征在于,包括:

收集新闻素材,创建新闻库;

从新闻库中获取目标事件的所有新闻文本,并进行热度分析,获取拐点新闻文本,抽取所述拐点新闻文本中的事件信息并保存;

其中,获取拐点新闻文本的方法包括:统计所有新闻文本的热度值,按照新闻文本发布的时间顺序排序,构建热度值随时间变化的曲线图,取曲线图的所有极大点对应的新闻文本,即为所述拐点新闻文本,所述热度值为新闻的页面浏览量和网站独立访客量之和。

优选地是,所述的新闻事件信息归纳方法中,从拐点新闻文本中抽取事件摘要,按照新闻文本发布的时间顺序排序并保存,即构成所述事件信息;

其中,所述事件摘要的抽取方法包括:

将所述拐点新闻文本进行分句处理,构建拐点新闻文本中所有句子之间的连通图;

应用文本摘要算法对连通图进行分析,获得每个句子的权重,将所有的句子依照权重大小进行排序,然后按照权重的排序从大到小选取预设数量的句子组合后保存为事件摘要;

其中,连通图的公式为:G=(V,E),连通图的构建方法为:将拐点新闻文本中每个句子都作为一个句子顶点,统计所有的句子顶点构成顶点集合V,如果一个句子与其他句子之间存在关系则形成边,统计所有的边构成边集合E。

优选的是,所述的新闻事件信息归纳方法中,所述事件信息还包括专业观点,所述专业观点的获取方法为:

创建观点库;

从收集的新闻素材中抽取观点素材存入观点库中;

从观点库中获取目标事件的所有观点文本;

对获取的所有观点文本进行聚类,得到观点簇集合,利用文本摘要算法分别提取每个观点簇的概要描述;

将每个观点簇中的观点文本与其相对应的概要描述保存在一起,即得所述专业观点。

优选的是,所述的新闻事件信息归纳方法中,所述观点文本包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;北京航空航天大学,未经国家计算机网络与信息安全管理中心;北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910207437.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top