[发明专利]基于显式事件结构知识增强的事件检测方法及终端设备有效
申请号: | 202110461202.6 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113111184B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 郑海涛;张奕麟;李自然 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06N3/04 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 事件 结构 知识 增强 检测 方法 终端设备 | ||
1.一种基于显式事件结构知识增强的事件检测方法,其特征在于,包括如下步骤:
S1:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;
S2:将所述事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;
S3:对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;
S4:将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,并根据事件触发词的类别确定所述输入句子对应的事件类型;
所述事件背景知识图的构建步骤包括:
S1.1:将事件触发词和事件论元的文字作为所述事件背景知识图的文本节点,将事件触发词和事件论元角色的注释标签作为知识节点;
S1.2:将各文本节点和知识节点分别进行连接,分别对事件触发词、事件论元和事件注释之间的关系,文本之间的关系,事件中的核心元素之间的关系,进行事件检测模型的构建;
各文本节点和知识节点的连接方式包括:
根据事件结构将对应的文本节点与知识节点进行纵向连接;
将事件触发词的文本节点与事件论元的文本节点进行文本横向连接;
将事件触发词的知识节点与同一事件内的其他论元角色的知识节点进行知识横向连接;
所述动态知识匹配的步骤包括:
S2.1:将所述事件背景知识图中事件触发词相关的背景知识与所述输入句子中的潜在事件触发词进行匹配;计算所述潜在事件触发词与所述事件背景知识图中事件触发词文本节点之间的事件触发词语义相似度得分;
S2.2:选择所述事件触发词语义相似度得分最高的前k个潜在事件触发词作为候选事件触发词,并将所述候选事件触发词的文本节点所匹配的知识节点的事件类型作为输入句子的候选事件类型;
S2.3:将输入句子中的潜在事件论元与所述事件背景知识图中的事件论元文本节点进行匹配;计算出所述潜在事件论元与所述事件背景知识图中事件论元文本节点之间的事件论元语义相似度得分;
S2.4:选择所述事件论元语义相似度得分最高的前k个潜在事件论元,基于所述S2.2获得的所述候选事件类型,选择属于所述候选事件类型的事件论元角色作为输入句子中所述事件论元的知识节点;
S2.5:采用所述S1.1-S1.2的方法构建所述输入句子的子图。
2.如权利要求1所述的基于显式事件结构知识增强的事件检测方法,其特征在于,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=cosine(E(wti),E(tnj))
其中,wti表示输入句子中的一个潜在事件触发词,tnj表示事件背景知识图中存在的与潜在事件触发词相同的事件触发词文本节点,cosine表示余弦相似度计算,E表示通过ELMo模型获取的词嵌入;
当所述潜在事件触发词未存在于所述事件背景知识图中时,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=α*cosine(E(wti),E(tnj))+(1-α)*cosine(E(st),E(stn))
其中α是人工设置的可调权重,st和stn是输入句子中词语的ELMO嵌入的平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110461202.6/1.html,转载请声明来源钻瓜专利网。