[发明专利]一种基于二分超球面原型网络的事件分类方法有效
申请号: | 202010738919.6 | 申请日: | 2020-07-28 |
公开(公告)号: | CN111985152B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 陈华钧;邓淑敏;张宁豫 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06N5/04 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二分 球面 原型 网络 事件 分类 方法 | ||
1.一种基于二分超球面原型网络的事件分类方法,其特征在于,所述事件分类方法包括以下步骤:
获取实例,编码实例中字段的词向量和位置向量后,利用实例表示模型根据实例对应的词向量和位置向量编码得到实例表示,并通过超球面映射函数得到实例在超球面上的表示;其中,编码实例中字段的词向量和位置向量包括:
针对表示为X={xi,i∈[1,L]}的实例,xi表示实例中的第i个字段,L为实例包含的最大字段数目;每个字段的嵌入表示x=[w,v],w表示预训练的词向量,v=[vb,ve,vl,]表示位置向量,vb,ve,vl分别表示字段到句首、句尾的距离和字段所属实例的字段长度;
根据每个事件包含的所有实例的超球面表示构建事件的原型表示,原型表示为:
其中,pk表示第k类事件的原型表示,Fs(·)表示原型点分布到超球面的映射函数,avg(·)表示平均函数,Xj表示第j个实例的实例表示,Jk为属于第k类事件的实例的总个数;
根据实例的超球面表示和实例所属事件的原型表示之间的距离差异构建分类损失,根据两个事件的原型表示到介质层的距离构建表示因果关系的推理损失,根据分类损失和推理损失构建得到总损失;其中,分类损失为:
其中,Lc表示分类损失,表示第j个实例的超球面表示与第k类事件的原型表示pk之间的夹角,|·|表示向量的模,‖·‖表示向量的二范数;
推理损失为:
其中,k和t表示事件的索引,pt表示第t类事件的原型表示,D(·)表示原型表示到介质层距离的函数,λ是超参数,K表示总事件类型数,s(pk,pt)表示pk与pt形成因果对的可能性;
总损失为:
L=αLc+(1-α)Lr
其中,L表示总损失,Lc表示分类损失,Lr表示推理损失,α为权重参数,取值为0~1;
根据总损失优化实例表示模型参数和损失函数超参数,优化结束后,得到参数确定的实例表示模型和优化后的原型表示;
应用时,根据参数确定的实例表示模型获得新实例的实例表示后,计算实例表示对应的超球面表示与所有优化后的原型表示的相似度,选择最高相似度对应的原型表示的事件类别为新实例的事件类别,其中,相似度为:
表示新实例的超球面表示,表示新实例的实例表示,argmax(·)表示对函数求参数的函数。
2.如权利要求1所述的基于二分超球面原型网络的事件分类方法,其特征在于,所述实例表示模型为CNN、RNN、BERT模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010738919.6/1.html,转载请声明来源钻瓜专利网。