[发明专利]基于显式事件结构知识增强的事件检测方法及终端设备有效

申请号：	202110461202.6	申请日：	2021-04-27
公开（公告）号：	CN113111184B	公开（公告）日：	2022-03-08
发明（设计）人：	郑海涛;张奕麟;李自然	申请（专利权）人：	清华大学深圳国际研究生院
主分类号：	G06F16/35	分类号：	G06F16/35;G06F16/36;G06N3/04
代理公司：	深圳新创友知识产权代理有限公司 44223	代理人：	江耀纯
地址：	518055 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于事件结构知识增强检测方法终端设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种基于显式事件结构知识增强的事件检测方法，包括如下步骤：根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图，实现对事件结构显式地构建事件检测模型；将事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配，构建属于所述输入句子的包含高度相关的事件背景知识的子图；对所述子图进行过滤和编码，并通过图卷积计算得到包含事件结构的知识的信息的图表示；将所述包含事件结构的知识的信息的图表示输入事件检测分类器中，确定事件触发词的类别，从而确定所述输入句子对应的事件类型。本发明提升了歧义触发词和生僻触发词的检测准确率和召回率，从而提升事件触发词的检测效果。

技术领域

本发明涉及自然语言处理技术领域，尤其是涉及基于显式事件结构知识增强的事件检测方法。

背景技术

事件检测旨在从非结构化的文本中识别特定类型的事件，但现有的事件检测任务中对于带有歧义的触发词和生僻触发词存在检测效率低下的问题，事件检测中的歧义触发词和生僻触发词示例如图1所示。由于自然语言自身带有一定的多样性和歧义性，相同的事件触发词可能会根据上下文语境的不同从而代表不同的事件类别。在没有其他额外的知识或信息作为参考的情况下，歧义触发词可能会导致事件检测系统错误地对触发词的事件类别进行标记。现有技术为解决歧义触发词的问题，通常对上下文中其他事件元素的信息进行学习，而并没有对事件自身的结构知识进行探索与利用。对事件检测任务来说，识别生僻触发词等未在训练数据集中出现过的事件触发词同样也是一项艰巨的挑战。现有的事件检测模型通常通过学习同种事件类型下其他事件触发词的通用知识来检测生僻触发词。因此，如何从其他事件中选择更合适的通用知识，并采用全方位的事件结构知识来增强生僻触发词的向量表示仍然值得探索。

发明内容

本发明的目的在于提供一种基于显式事件结构知识增强的事件检测方法，以解决歧义触发词和生僻触发词检测准确率和召回率低的技术问题。

为实现上述目的，本发明采用下述技术方案：

一种基于显式事件结构知识增强的事件检测方法，其特征在于，包括如下步骤：

S1：根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图，实现对事件结构显式地构建事件检测模型；

S2：将所述事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配，构建属于所述输入句子的包含高度相关的事件背景知识的子图；

S3：对所述子图进行过滤和编码，并通过图卷积计算得到包含事件结构的知识的信息的图表示；

S4：将所述包含事件结构的知识的信息的图表示输入事件检测分类器中，确定事件触发词的类别，并根据事件触发词的类别确定所述输入句子对应的事件类型。

在一些实施例中，所述事件背景知识图的构建步骤包括：

S1.1：将事件触发词和事件论元的文字作为所述事件背景知识图的文本节点，将事件触发词和事件论元角色的注释标签作为知识节点；

S1.2：将各文本节点和知识节点分别进行连接，分别对事件触发词、事件论元和事件注释之间的关系，文本之间的关系，事件中的核心元素之间的关系，进行事件检测模型的构建；

在一些实施例中，各文本节点和知识节点的连接方式包括：