[发明专利]一种基于区分性词向量表示的事件检测方法有效
申请号: | 202110726463.6 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113282714B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 唐九阳;廖劲智;赵翔;李欣奕;谭真;陈盈果;黄魁华 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/126;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 长沙大珂知识产权代理事务所(普通合伙) 43236 | 代理人: | 伍志祥 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 区分 向量 表示 事件 检测 方法 | ||
本发明一种基于区分性词向量表示的事件检测方法,所述方法包括:构建一种基于区分性词向量表示模型,包括编码模块、高斯核函数模块和对抗学习模块,所述的编码模块用于将句子中的每个单词生成高维向量空间中的表示,所述的高斯核函数模块,用于加大触发词内部组成单词与外部其他单词之间表示的区分性,所述的对抗学习模块,用于提升对触发词正样本的泛化识别能力;利用训练好的区分性词向量表示模型,在所有事件类型上逐一对每个单词预测是否属于该类下某一个触发词的起始位置或者结束位置,然后通过组合预测的开始位置和结束位置输出所有可能的触发词。
技术领域
本发明涉及自然语言处理中的事件检测技术领域,尤其涉及一种基于区分性词向量表示的事件检测方法。
背景技术
从文本中检索、抽取事件实例在自动问答、对话系统等自然语言相关任务中发挥着关键作用,而其中首先要完成的工作就是事件检测。事件检测(event detection,ED)致力于解决两个方面的问题:1)识别触发词,触发词是一类用以指使文本中特定事件的词语,包括但不限于单个动词、名词或者词组;2)判定分类,通过触发词及相关文本判定该触发词所属类别。
由于ED有利于自然语言处理中的许多下游应用,如问答、时空事件信息检索和机器阅读理解,ED引起了研究人员的广泛注意。具体来说,现有的方法中存在结合特征工程技术来手工构造特征;为解决数据的稀缺,采用了数据增强技术来增加训练数据的规模;以及基于最近神经网络的发展,引入潜在词表示,以更好地执行ED。
在ED的两个子任务之间,触发词识别的结果是触发词分类的基础。然而,正确识别触发词并非易事,因为当前数据稀缺成为ED中一个不可忽略的问题,这就需要模型能够更精准地判定句子中触发词的文本边界。然而,如果模型未关注单词的表示,会使得词向量包含的语义信息过于模糊,进而导致检测触发词的边界成为了一个棘手的挑战。在这种情况下,如果模型过于“谨慎”,它会倾向于做有把握的预测,可能忽略部分触发词,从而错过某些事件;而如果模型“大胆”,它可能会引入许多预测噪声,进而增大探测触发词边界的困难。本实施例将该问题定义为事件检测中的触发词片段检测问题。
这个问题严重影响了ED的表现。首先,现有的ED方法会产生许多假阴性的情况,其准确率远高于召回率。其次,错误分析显示,83%以上的错案被认为是由该问题引起的。在这种情况下,PLMEE,一种具有代表性的最先进(SOTA)方法,不仅错误预测了触发词的数量,而且混淆了触发词的特定边界(例如,“penalty”和“death penalty”)。此外,当前的ED方法忽略了触发词片段检测的问题,并且在识别事件触发词时缺乏专门的处理方法。
发明内容
本发明旨在至少解决现有技术中存在的技术问题。为此,本发明提出了一种基于区分性词向量表示的事件检测方法。所述方法从文本中学习区分性词向量表示(DER),有了DER,模型期望能够精准地识别每个触发词,并正确标记其片段。为了实现这一目标,本发明方法提出了一个基于神经信息抽取的经典解决方案的新框架,该框架利用了两种有前景的技术:1)高斯核函数编码,它扩大了触发词内部单词和外部句子中其他单词表示之间的差异,2)对抗学习策略,该策略提升对触发词正样本的泛化识别能力。
一种基于区分性词向量表示的事件检测方法,所述方法包括:
步骤1,构建区分性词向量表示模型,包括编码模块、高斯核函数模块和对抗学习模块,所述的编码模块用于将句子中的每个单词生成高维向量空间中的表示,所述的高斯核函数模块,用于加大触发词内部组成单词与外部其他单词之间表示的差异性,所述的对抗学习模块,用于提升对触发词正样本的泛化识别能力;
步骤2,在所述的编码模块中,通过使用预训练BERT模型将句子的每个单词嵌入到高维向量空间中的上下文词向量表示中,以便提供包含语义特征的输入,同时,结合预定义事件类型的外部知识,进一步丰富单词表示中包含的信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110726463.6/2.html,转载请声明来源钻瓜专利网。