[发明专利]一种基于二分超球面原型网络的事件分类方法有效
申请号: | 202010738919.6 | 申请日: | 2020-07-28 |
公开(公告)号: | CN111985152B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 陈华钧;邓淑敏;张宁豫 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06N5/04 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二分 球面 原型 网络 事件 分类 方法 | ||
本发明公开了一种基于二分超球面原型网络的事件分类方法,包括:获取实例,利用实例表示模型编码得到实例表示;构建事件的原型表示;根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失,根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失,根据分类损失和推理损失构建得到总损失;根据总损失优化模型参数,得到参数确定的实例表示模型和优化后的原型表示;根据实例表示模型获得新实例的实例表示后,计算实例表示对应的超球面表示与所有优化后的原型表示的相似度,选择最高相似度对应的原型表示的事件类别为新实例的事件类别。通过事件之间的先验知识进行融合推理来事件分类,提升了事件分类的准确性。
技术领域
本发明属于信息抽取及推理技术领域,具体涉及一种基于二分超球面原型网络的事件分类方法。
背景技术
传统的事件抽取模型总是基于监督学习的,因而需要充足的训练样本,但在真实世界中大量的标记样本往往是难以获取的。而且,事件抽取的效果随着样本数的减少而减弱。但是,目前的大部分模型都假设充足的训练样本是学习事件表示必不可少的条件,这使得事件抽取任务难以取得理想的效果。因此,让模型可以在低资源的情况下抽取事件就格外重要。传统的低资源事件抽取模型主要是基于监督学习,迁移学习/预训练,或者元学习,虽然它们也可以取得不错的效果,但都是数据驱动的模型,对数据的依赖太强,而且忽略了事件本身的隐含先验信息,比如,事件之间的因果关系。
从直觉上来看,建模事件之间的隐含关系有利于增强低资源事件抽取的效果,比如袭击事件包含461个实例,受伤事件包含53个实例,而袭击事件将会导致受伤事件,如果模型可以捕获这两类事件之间的因果关系,将知识从袭击因事件迁移到受伤果事件,那么将促进低资源事件的抽取效果,而且这种促进效果在事件实例极其小的时候表现尤为明显。
申请公布号为CN104598535A的专利申请公开了一种基于最大熵的事件抽取方法,申请公布号为CN106951530A的专利申请公开了一种事件类型抽取方法和装置。这两个技术方案的事情抽取方法对于低资源事件抽取效果均不好。
发明内容
本发明的目的是提供一种基于二分超球面原型网络的事件分类方法,特别适用于低资源事件的分类,通过事件之间的先验知识进行融合推理来事件分类,提升了事件分类的准确性。
为实现上述发明目的,本发明提供以下技术方案:
一种基于二分超球面原型网络的事件抽取方法,所述事件抽取方法包括以下步骤:
获取实例,编码实例中字段的词向量和位置向量后,利用实例表示模型根据实例对应的词向量和位置向量编码得到实例表示,并通过超球面映射函数得到实例在超球面上的表示;
根据每个事件包含的所有实例的实例表示构建事件的原型表示;
根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失,根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失,根据分类损失和推理损失构建得到总损失;
根据总损失优化实例表示模型参数和损失函数超参数,优化结束后,得到参数确定的实例表示模型和优化后的原型表示;
应用时,根据参数确定的实例表示模型获得新实例的实例表示后,计算实例表示对应的超球面表示与所有优化后的原型表示的相似度,选择最高相似度对应的原型表示的事件类别为新实例的事件类别。
与现有技术相比,本发明具有的有益效果至少包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010738919.6/2.html,转载请声明来源钻瓜专利网。