[发明专利]融合依存信息和预训练语言模型的事件抽取方法及系统有效
申请号: | 202010398752.3 | 申请日: | 2020-05-12 |
公开(公告)号: | CN111897908B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 靳小龙;郭嘉丰;程学旗;延浩然;官赛萍;范意兴;席鹏弼 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/35;G06F16/36;G06F40/211;G06F40/289;G06F40/295;G06N3/04 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 依存 信息 训练 语言 模型 事件 抽取 方法 系统 | ||
1.一种融合依存信息和预训练语言模型的事件抽取方法,其特征在于,包括:
预处理步骤,对待事件抽取文本进行分句、分词、实体提取和句子级依存分析,得到中间数据,将该中间数据中触发词转换为BIO标注格式,得到预处理语料;
预编码步骤,以该预处理语料中句子的词序列作为输入,使用BERT预训练语言模型的分词模块进行分词,得到子词序列,输入至BERT预训练语言模型的多层Transformer模型对该子词序列进行预编码,得到预编码结果和句子的依存句法树;
图卷积神经网络学习步骤,将该依存句法树转换为自环双向连通图,以该预编码结果和该自环双向连通图为输入,使用多层图卷积神经网络学习词级依存句法特征,得到词编码结果;
事件抽取步骤,以该词编码结果为输入,得到任意两个单词间的依存关系;融合该编码结果中的字、词特征,以字级别序列标注的方式进行触发词抽取,得到触发词;合并该编码结果中的实体和该触发词,通过判断实体在该触发词所在事件中是否为其论元,得到论元角色;集合该依存关系、该触发词和该论元角色作为该待事件抽取文本的事件抽取结果;
该事件抽取步骤中依存关系的确定方法为:
d′i,j=sigmoid(WD g(WDT[pi,pj]))
其中WD和WDT是线性变换矩阵,g是ReLU非线性激活函数,d’i,j为该依存关系且d'i,j∈[0,1];
实体entityi的最终表达ei如下:
ei=[hei||triggeri||eventi]
其中hei为实体entityi按词进行平均池化操作得到的平均表达,triggeri为触发词的平均池化表达,eventi为实体类型向量;
然后使用Softmax分类器进行多分类:
其中是实体entityi为论元角色t的概率,Warg是线性变换矩阵,Narg是论元角色的种类数。
2.如权利要求1所述的融合依存信息和预训练语言模型的事件抽取方法,其特征在于,该预处理步骤包括:使用自然语言处理工具对待事件抽取文本首先进行分句,然后对每个分句进行分词、实体识别和依存分析操作。
3.如权利要求1所述的融合依存信息和预训练语言模型的事件抽取方法,其特征在于,该图卷积神经网络学习步骤包括:将该依存句法树加入自环和反向边,构成一个带自环的双向连通图,保留该双向连通图“正向”、“反向”和“自环”三种类型的边,分别命名为Aalong,Arev和Aloop;
使用多层迭代式的该图卷积神经网络通过下式对该预编码结果中词序列进行编码:
其中fconv(·)是图卷积网络的卷积函数,是元素级加法运算,模型每次会将第k-1层的图表达作为输入,使用Aalong,Arev和Aloop分别进行图卷积的计算,然后进行求和,作为第i个单词第k层的图表达,具体来说,
其中σ是非线性激活函数,Wa,k和∈a,k分别是子图a在第k层图卷积的线性变换矩阵及其偏置,dg(Aalong/rev/loop,i)计算了节点i在子图中的度,用于归一化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010398752.3/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置