[发明专利]利用拓扑依存关系多视角图编码器的论元抽取方法有效

专利信息
申请号: 202110594279.0 申请日: 2021-05-28
公开(公告)号: CN113222119B 公开(公告)日: 2022-09-20
发明(设计)人: 罗森林;祁佳俊;吴舟婷;周妍汝;董勃 申请(专利权)人: 北京理工大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08;G06F40/284;G06F16/28
代理公司: 暂无信息 代理人: 暂无信息
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 利用 拓扑 依存 关系 视角 编码器 抽取 方法
【说明书】:

发明涉及利用拓扑依存关系多视角图编码器的论元抽取方法,属于自然语言处理与机器学习领域。主要为了解决采用单类型特征建模提取论元时,造成多种角色的论元特征表示易受到与候选论元无语义关联信息的干扰,导致多角色论元的特征表示不准确的问题。本发明首先利用BERT预训练模型对数据集实现文本嵌入,得到文本嵌入向量,触发词类别嵌入向量和实体类别嵌入向量;然后对候选论元、实体类别和触发词之间的拓扑关系进项建模,构建多视角图信息网络;最后利用图卷积网络分别对多视角图编码,聚合得到候选论元多视角图嵌入向量,经过SoftMax全连接层从候选论元中分类抽取事件论元。在ACE2005英文语料上进行实验,结果表明本发明能达到较好的论元抽取效果。

技术领域

本发明涉及利用拓扑依存关系多视角图编码器的论元抽取方法,属于自然语言处理与机器学习领域。

背景技术

论元抽取的目标是抽取事件句中相对应的论元实体,并为其标注时间、地点、人物等论元角色,从而实现包含事件信息的无结构文本的结构化输出。

在论元抽取任务中,一种触发词类别对应几种特定角色的论元,某一种论元由特定类别的实体来表示,同时论元与论元之间又通过句法结构相联系,由此可见,候选论元、实体类别和触发词之间存在一定的拓扑关系。

候选句中触发词类别、实体类别、候选论元等多类型特征均能对论元的准确抽取提供有效的指导,根据特征构建方式不同,现有论元抽取方法主要分为基于向量拼接的方法、基于序列建模的方法和基于拓扑结构构建的方法。

1.基于向量拼接的方法

基于向量拼接的论元抽取方法利用不同类型特征向量拼接的方式实现多类型特征构建。但该方法往往利用单类型特征向量直接引入或直接计算的方式构建特征,这种特征构建方式未考虑到句法结构对于论元分布的指导作用,使得对事件中的论元实体难以做出直接准确的定位,导致候选实体中角色标注不准确的问题。

2.基于序列建模的方法

基于序列建模的论元抽取方法通过序列模型构建的方式实现多类型特征融合。该方法利用的特征构建方式与上述向量拼接方法相同,直接计算单一类型特征向量来构建特征,使得难以直接准确定位事件的论元实体,最终导致实体角色标注不准确的问题。

3.基于拓扑结构的方法

基于拓扑结构构建的论元抽取方法主要研究不同类型特征之间拓扑结构的构建。该方法考虑到了拓扑结构信息对于指导论元抽取的有效性,但该方法只在候选论元之间构建了句法关系,未考虑到候选论元-触发词类别和候选论元-实体类别之间拓扑关系的构建,影响候选论元特征表示的准确性,导致对应多种角色的候选论元在进行特征建模时指导信息利用不足,论元识别和分类准确性低的问题。

综上所述,现有方法往往仅考虑候选论元-候选论元之间依存关系的构建,常采用向量拼接或序列建模的方式引入触发词类别及实体类别信息,未考虑候选论元-触发词类别和候选论元-实体类别特征之间的拓扑关系构建,使得在具有相同共现词的候选句中,采用单类型特征建模的论元抽取方法进行论元抽取时,会造成对应多种角色的论元特征表示易受到与候选论元无语义关联信息的干扰,导致多角色论元的特征表示不准确,影响论元抽取效果。

发明内容

本发明的目的是针对采用单类型特征建模提取论元时,造成多种角色的论元特征表示易受到与候选论元无语义关联信息的干扰,导致多角色论元的特征表示不准确的问题,提出了利用拓扑依存关系多视角图编码器的论元抽取方法。

本发明的设计原理为:首先,利用BERT预训练模型对数据集实现文本嵌入;其次,通过构建多视角图的方式对候选论元、触发词类别和实体类别三个类型特征之间的相关关系进行建模;然后,利用图卷积网络(GCN)对从不同角度构建的三个图进行编码,并得到候选论元的多视角图嵌入向量;最后,经过Softmax全连接层分类抽取得到事件论元。

本发明的技术方案是通过如下步骤实现的:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110594279.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top