[发明专利]一种事件类型识别方法及装置有效
申请号: | 201610409465.1 | 申请日: | 2016-06-12 |
公开(公告)号: | CN106095928B | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 佟玲玲;杜翠兰;钮艳;刘洋;段东圣;鲁睿;程光;项菲;柳毅 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F17/27 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 田卫平 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种事件类型识别方法及装置。该方法包括以下步骤:对训练集中所有文本进行分词、提取词性处理后训练词向量空间模型,提取文本的特征,将文本表示为特征向量;对于训练集进行事件类型聚类,训练带有类型聚类正则化项的神经网络模型;对于测试样本同样进行分析、提取词性处理,并利用已经训练好的词向量模型,得到特征表示;利用类型聚类正则化项的神经网络模型进行事件类别识别。借助于本发明的技术方案,能够利用同一群组中的类型共享信息来减轻标注数据不平衡带来的问题。 | ||
搜索关键词: | 一种 事件 类型 识别 方法 装置 | ||
【主权项】:
1.一种事件类型识别方法,其特征在于,包括以下步骤:对训练样本集中所有文本进行分词、标注词性处理后进行词向量模型训练,根据词向量模型的输出得到训练样本集中每个词语的词向量;将训练样本集中的预定词性的词语作为事件触发词,根据事件触发词的词向量,将触发词及触发词的上下文表示为特征向量ri,进而将训练样本集表示为特征向量[r1,r2,...,rn];在特征向量ri的基础上加入事件类型向量得到特征向量v,对训练样本集进行事件类型聚类,得到多个聚类簇并进行处理;根据所述聚类簇,训练所述训练样本集,得到带有类型聚类正则化项的神经网络模型;对测试样本集中所有文本进行分词、标注词性处理后输入所述词向量模型得到测试样本中每个词语的词向量;将测试样本集中预定词性的词语作为事件触发词,根据事件触发词的词向量,将触发词及触发词的上下文表示为特征向量,进而将测试样本表示为特征向量,所述测试样本为测试样本集中的文本;将测试样本的特征向量输入到所述带有类型聚类正则化项的神经网络模型,然后进行softmax操作得到测试样本属于某一事件的概率;根据所述聚类簇,训练所述训练样本集,得到带有类型聚类正则化项的神经网络模型包括以下步骤:对训练集合(x(i);y(i)),定义负对数似然损失函数J(θ),
在公式3,J(θ)表示负对数似然损失函数,y(i)表示一个事件类别的标签;x(i)代表训练样本,θ代表参数;定义正则化项R(θ),
在公式4中,c是C中的一个聚类簇;C代表训练样本集中所有的聚类簇;n(c,k)代表第c聚类簇中第k个事件类型的触发词个数,Wo代表输出层的权重矩阵,
代表第c类簇中第k个事件类型的权重;
代表c中所有权重向量的平均值;
其中,
代表第c聚类簇中第j个事件类型的权重;将J(θ)和R(θ)代入公式5,采用随机梯度下降法将损失函数最小化获得θ的值;损失函数J′(θ),J′(θ)=J(θ)+αR(θ) 公式5;在公式5中,J′(θ)代表损失函数,α是权衡J(θ)和R(θ)的超参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610409465.1/,转载请声明来源钻瓜专利网。