[发明专利]一种事件分析方法、装置、存储介质及电子设备在审
申请号: | 202110788538.3 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113553397A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 李嘉琛;付骁弈 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06K9/62 |
代理公司: | 成都众恒智合专利代理事务所(普通合伙) 51239 | 代理人: | 赵健淳 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 分析 方法 装置 存储 介质 电子设备 | ||
本申请提供了一种事件分析方法、装置、存储介质及电子设备,事件分析方法包括:获取文本数据;将文本数据输入至预先训练好的事件分析模型中,得到文本数据中的每个事件以及每两个事件之间的关系类型。本申请利用预先训练好的事件分析模型对文本数据进行分析处理之后,便能够得到文本数据中的每个事件以及每两个事件之间的关系类型,无需再多其他的模型或计算,相较于现有技术中的两个独立模型,训练过程以及应用的过程均较为便捷,无需人为过多的操作,进而提高了事件分析效率。
技术领域
本申请涉及时间抽取技术领域,特别涉及一种事件分析方法、装置、存储介质及电子设备。
背景技术
事件抽取是信息抽取技术中的一个子领域,具体地,可以从海量文本数据中抽取事件,事件与事件之间可能存在着因果关系、时序关系等多种类型的关系。举例,在航空领域,航空故障事件通常是由论元和触发词构成的结构体,例如,文本数据为「密封剂渗入了电线压接区,导致电线短路,随后飞机起火。」中的事件是「密封剂渗入了电线压接区」,「电线短路」和「飞机起火」,通常论元是一个与航空相关的名词或名词词组,例如航空器元件、机组人员等;触发词通常是一个动词,例如短路、起火等。
现有技术中,事件抽取通常可以视为序列标注或机器阅读理解任务,可以通过双向长短记忆神经网络、指针神经网络等模型完成;而,事件关系确定是一个分类任务,对两个事件的文本进行特征提取,训练支持向量机模型、神经网络等分类模型完成。也就是说,现有技术中需要两个独立的模型来分别完成,但对于两个独立的模型来说,训练过程以及应用的过程均较为繁琐,需要人为操作较多,并且,事件分析效率较低。
发明内容
有鉴于此,本申请实施例提出了一种事件分析方法、装置、存储介质及电子设备,用以解决现有技术中选训练过程以及应用的过程均较为繁琐,需要人为操作较多,以及事件分析效率较低的问题。
第一方面,本申请实施例提供了一种事件分析方法,包括:
获取文本数据;
将所述文本数据输入至预先训练好的事件分析模型中,得到所述文本数据中的每个事件以及每两个所述事件之间的关系类型。
在一种可能的实施方式中,所述将所述文本数据输入至预先训练好的事件分析模型中,得到所述文本数据中的每个事件,包括:
利用所述事件分析模型将所述文本数据中的每个所述单元进行向量化,得到每个所述单元对应的特征向量;
对每个所述特征向量进行标注,得到标签为预定值的目标向量;
基于所述目标向量确定所述文本数据中的每个事件。
在一种可能的实施方式中,所述将所述文本数据输入至预先训练好的事件分析模型中,得到每两个所述事件之间的关系类型,包括:
提取所述第一事件中的第一目标向量以及提取所述第二事件中的第二目标向量;
计算所述第一目标向量与所述第二目标向量之间的关联值;
基于所述关联值确定所述第一事件与所述第二事件之间的关系类型。
在一种可能的实施方式中,所述第一事件中包含n个第一目标向量,所述第二事件中包含m个第二目标向量;
所述计算所述第一目标向量与所述第二目标向量之间的关联值,包括:
针对每类预设关系,利用该预设关系对应的特定值,分别对每个所述第一目标向量与每个所述第二目标向量进行计算,得到n·m个关联值。
在一种可能的实施方式中,利用如下公式计算所述第一目标向量与所述第二目标向量之间的关联值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110788538.3/2.html,转载请声明来源钻瓜专利网。