[发明专利]事件脉络生成方法、装置、终端设备及存储介质在审
申请号: | 202011229516.5 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112328747A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 殷子墨 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/289 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 任敏 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 脉络 生成 方法 装置 终端设备 存储 介质 | ||
本申请适用于人工智能技术领域,提供了一种事件脉络生成方法、装置、终端设备及存储介质,该方法包括:分别获取多个事件文档中的第一时间信息以及事件信息,得到多个事件文档中对应的多个第一时间事件对;统一多个第一时间信息的时间表达方式得到多个第二时间信息,并将多个第二时间信息对应替换多个第一时间信息得到多个第二时间事件对;从多个第二时间事件对中,确定与多个第二时间信息对应的目标事件信息;根据目标事件信息的第二时间信息,对目标事件信息进行排序生成事件脉络。通过上述方法生成的事件脉络,可在事件文档中涵盖多个时间节点下的事件信息时,为每个时间节点均生成相应的事件信息,进而可根据时间节点生成清晰的事件脉络。
技术领域
本申请属于人工智能技术领域,尤其涉及一种事件脉络生成方法、装置、终端设备及存储介质。
背景技术
事件脉络是一种对于长时间发展的新闻事件的展示形式。这类事件通常在一个较长的时间段内持续的发生变化或引发社会影响,不断出现连锁反应或相关事件。对于这类事件,经常通过时间节点与关键事件内容的展示形式来描述完整事件,有利于用户快速把握事件全貌。但是,目前事件脉络的自动生成方法中,终端设备均是通过新闻发布的时间对新闻包含的事件进行梳理。然而,在一篇新闻涵盖多个时间节点下的事件信息时,多个时间节点下的事件信息将会被作为是在一个时间节点(新闻发布时间)下发生的事件,以至于无法生成清晰的事件脉络。
发明内容
本申请实施例提供了一种事件脉络生成方法、装置、终端设备及存储介质,可以解决一篇新闻中在涵盖了多个时间节点下的事件信息时,多个时间节点下的事件信息将会被作为是在一个时间节点下发生的事件,以至于无法生成清晰的事件脉络的问题。
第一方面,本申请实施例提供了一种事件脉络生成方法,包括:
分别获取多个事件文档中的第一时间信息以及事件信息,得到与所述多个事件文档中对应的多个第一时间事件对;
统一所述多个第一时间事件对中多个第一时间信息的时间表达方式,得到统一后的多个第二时间信息,并将所述统一后的多个第二时间信息分别对应替换所述多个第一时间事件对的第一时间信息,得到多个第二时间事件对;
从所述多个第二时间事件对中,确定与所述多个第二时间信息对应的目标事件信息;
根据所述目标事件信息对应的第二时间信息,对所述目标事件信息进行排序生成事件脉络。
在一实施例中,所述第一时间信息包括多种时间表达方式,所述分别获取多个事件文档中的第一时间信息以及事件信息,得到所述多个事件文档中分别对应的多个第一时间事件对,包括:
根据所述多种时间表述方式,查询所述多个事件文档中符合任一时间表达方式的多个第一时间信息;
将所述多个第一时间信息与对应的所述多个事件文档分别输入至序列标注模型中,确定与所述多个第一时间信息分别相配对的事件信息,得到所述多个第一时间事件对。
在一实施例中,所述分别获取多个事件文档中的第一时间信息以及事件信息,包括:
分别获取每个事件文档中的每个第一时间信息,确定所述每个第一时间信息分别在对应的事件文档中的一个或多个第一文档位置;
对所述每个事件文档进行分词处理,得到所述每个事件文档中的多个分词;
确定所述每个事件文档中,所述多个分词分别在对应的事件文档中的多个第二文档位置;
根据所述一个或多个第一文档位置和所述多个第二文档位置,从所述多个分词中确定与所述第一时间信息相配对的目标分词,生成所述每个事件文档中与所述每个第一时间信息对应的事件信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011229516.5/2.html,转载请声明来源钻瓜专利网。