[发明专利]利用拓扑依存关系多视角图编码器的论元抽取方法有效
申请号: | 202110594279.0 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113222119B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 罗森林;祁佳俊;吴舟婷;周妍汝;董勃 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F40/284;G06F16/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 拓扑 依存 关系 视角 编码器 抽取 方法 | ||
本发明涉及利用拓扑依存关系多视角图编码器的论元抽取方法,属于自然语言处理与机器学习领域。主要为了解决采用单类型特征建模提取论元时,造成多种角色的论元特征表示易受到与候选论元无语义关联信息的干扰,导致多角色论元的特征表示不准确的问题。本发明首先利用BERT预训练模型对数据集实现文本嵌入,得到文本嵌入向量,触发词类别嵌入向量和实体类别嵌入向量;然后对候选论元、实体类别和触发词之间的拓扑关系进项建模,构建多视角图信息网络;最后利用图卷积网络分别对多视角图编码,聚合得到候选论元多视角图嵌入向量,经过SoftMax全连接层从候选论元中分类抽取事件论元。在ACE2005英文语料上进行实验,结果表明本发明能达到较好的论元抽取效果。
技术领域
本发明涉及利用拓扑依存关系多视角图编码器的论元抽取方法,属于自然语言处理与机器学习领域。
背景技术
论元抽取的目标是抽取事件句中相对应的论元实体,并为其标注时间、地点、人物等论元角色,从而实现包含事件信息的无结构文本的结构化输出。
在论元抽取任务中,一种触发词类别对应几种特定角色的论元,某一种论元由特定类别的实体来表示,同时论元与论元之间又通过句法结构相联系,由此可见,候选论元、实体类别和触发词之间存在一定的拓扑关系。
候选句中触发词类别、实体类别、候选论元等多类型特征均能对论元的准确抽取提供有效的指导,根据特征构建方式不同,现有论元抽取方法主要分为基于向量拼接的方法、基于序列建模的方法和基于拓扑结构构建的方法。
1.基于向量拼接的方法
基于向量拼接的论元抽取方法利用不同类型特征向量拼接的方式实现多类型特征构建。但该方法往往利用单类型特征向量直接引入或直接计算的方式构建特征,这种特征构建方式未考虑到句法结构对于论元分布的指导作用,使得对事件中的论元实体难以做出直接准确的定位,导致候选实体中角色标注不准确的问题。
2.基于序列建模的方法
基于序列建模的论元抽取方法通过序列模型构建的方式实现多类型特征融合。该方法利用的特征构建方式与上述向量拼接方法相同,直接计算单一类型特征向量来构建特征,使得难以直接准确定位事件的论元实体,最终导致实体角色标注不准确的问题。
3.基于拓扑结构的方法
基于拓扑结构构建的论元抽取方法主要研究不同类型特征之间拓扑结构的构建。该方法考虑到了拓扑结构信息对于指导论元抽取的有效性,但该方法只在候选论元之间构建了句法关系,未考虑到候选论元-触发词类别和候选论元-实体类别之间拓扑关系的构建,影响候选论元特征表示的准确性,导致对应多种角色的候选论元在进行特征建模时指导信息利用不足,论元识别和分类准确性低的问题。
综上所述,现有方法往往仅考虑候选论元-候选论元之间依存关系的构建,常采用向量拼接或序列建模的方式引入触发词类别及实体类别信息,未考虑候选论元-触发词类别和候选论元-实体类别特征之间的拓扑关系构建,使得在具有相同共现词的候选句中,采用单类型特征建模的论元抽取方法进行论元抽取时,会造成对应多种角色的论元特征表示易受到与候选论元无语义关联信息的干扰,导致多角色论元的特征表示不准确,影响论元抽取效果。
发明内容
本发明的目的是针对采用单类型特征建模提取论元时,造成多种角色的论元特征表示易受到与候选论元无语义关联信息的干扰,导致多角色论元的特征表示不准确的问题,提出了利用拓扑依存关系多视角图编码器的论元抽取方法。
本发明的设计原理为:首先,利用BERT预训练模型对数据集实现文本嵌入;其次,通过构建多视角图的方式对候选论元、触发词类别和实体类别三个类型特征之间的相关关系进行建模;然后,利用图卷积网络(GCN)对从不同角度构建的三个图进行编码,并得到候选论元的多视角图嵌入向量;最后,经过Softmax全连接层分类抽取得到事件论元。
本发明的技术方案是通过如下步骤实现的:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594279.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种圆形料场堆取料机
- 下一篇:一种文件处理方法、装置、设备及存储介质