[发明专利]一种事件抽取方法、装置和计算机可读存储介质在审

专利信息
申请号: 202010434130.1 申请日: 2020-05-21
公开(公告)号: CN111723568A 公开(公告)日: 2020-09-29
发明(设计)人: 徐猛;付骁弈;张杰 申请(专利权)人: 上海明略人工智能(集团)有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京安信方达知识产权代理有限公司 11262 代理人: 王康;龙洪
地址: 200232 上海市徐*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 事件 抽取 方法 装置 计算机 可读 存储 介质
【权利要求书】:

1.一种事件抽取方法,其特征在于,所述方法包括:

获得待进行事件抽取的文本中每一条语句的向量化语义表示W1;

通过多标签分类对所述每一条语句的向量化语义表示W1进行事件类型识别;并对所述每一条语句的向量化语义表示W1进行片段span划分,获得每个span的语义表示W2;

将识别出的每种事件类型以及所述每个span的语义表示W2进行两两配对,获取多个事件类型-span对,对所述多个事件类型-span对进行分类,以确定每一个事件类型-span对中的span是否属于该事件类型-span对中的事件类型所对应事件的论元。

2.根据权利要求1所述的事件抽取方法,其特征在于,所述方法还包括:预先将事件类型划分为x种,将事件的论元类型划分为y种,将所述事件类型以及所述论元类型以外的类型作为其他类型other;其中,x、y均为正整数;

在获得语句的向量化语义表示W1之前,包括以下操作:

事件类型标记:对所述文本进行事件类型标记,其中,如果所述文本中包含几种事件类型,则将预先划分出的x种事件类型和所述其他类型other所构成的事件类型向量中该几种事件类型的对应位置处记为第一标识,并将所述事件类型向量中非该几种事件类型对应位置处标记为第二标识;获取所标记的事件类型的embedding以及所述事件类型的embedding的向量D_event;

论元标记:对每种事件类型以及每个span进行两两组合,并标记每个组合是否为事件类型-论元对;其中,当该组合是事件类型-论元对时,标记论元类型,当该组合不是事件类型-论元对时,标记为所述其他类型other。

3.根据权利要求2所述的事件抽取方法,其特征在于,所述获得待进行事件抽取的文本中每一条语句的向量化语义表示W1包括:通过双向LSTM网络模型或BERT模型获得每一条语句的向量化语义表示W1。

4.根据权利要求3所述的事件抽取方法,其特征在于,在通过双向LSTM网络获得每一条语句的向量化语义表示W1之前,所述方法还包括:

将语句中的a个字符随机初始化为一个维度为[a,b]的b维向量D,其中,对于从0到a-1的索引id,每个id对应一个不同的字符;对于长度为S的语句,该语句中每一个字符能够在向量D中找到对应的id,从而获得维度为[S,D]的向量;

通过双向LSTM网络获得每一条语句的向量化语义表示W1包括:将维度为[S,D]的向量输入预设的双向LSTM神经网络,将所述双向LSTM神经网络的输出作为语句的向量化语义表示W1;

其中,所述向量化语义表示W1的维度为[S,D1];D1为2*LSTM隐层节点数。

5.根据权利要求3所述的事件抽取方法,其特征在于,通过BERT模型获得每一条语句的向量化语义表示W1包括:将语句直接输入所述BERT模型,将所述BERT模型的输出作为语句的向量化语义表示W1;

其中,所述向量化语义表示W1的维度为[S,D1];D1=768。

6.根据权利要求4所述的事件抽取方法,其特征在于,所述通过多标签分类对所述每一条语句的向量化语义表示W1进行事件类型识别包括:

对所述每一条语句的向量化语义表示W1进行最大池化操作,获得一个维度为[1,D1]的语义表示W3;

将所述语义表示W3作为输入数据,输入第一两层全连接神经网络,通过所述第一两层全连接神经网络和sigmoid层进行分类,输出一个维度为[1,x+1]的向量W4;其中所述向量W4中的每一个数值处于0-1之间,并且每一个数值分别对应x种事件类型和所述其他类型other这x+1种事件类型中的一种,所述向量W4表征属于所述x+1种事件类型中每一种事件类型的概率;

将所述向量W4中大于预设阈值的数值对应的一种或多种事件类型识别为所述所述每一条语句的向量化语义表示W1所属的事件类型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010434130.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top