[发明专利]基于对抗模仿学习的事件识别及分类方法、系统、装置有效
申请号: | 201910440322.0 | 申请日: | 2019-05-24 |
公开(公告)号: | CN110209816B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 陈玉博;刘康;赵军;刘健 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/126 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对抗 模仿 学习 事件 识别 分类 方法 系统 装置 | ||
1.一种基于对抗模仿学习的事件识别及分类方法,其特征在于,该识别及分类方法包括:
步骤S10,获取不含标准标注信息的句子作为输入信息;
步骤S20,对所述输入信息中每一个词进行特征化操作,获得对应的词向量集构成词向量特征矩阵;
步骤S30,采用向量编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量;
步骤S40,基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率;
步骤S50,以概率值最高的事件类别作为所述输入信息的事件类别;
其中,所述向量编码器,其训练方法为:
步骤B10,获取含有标签向量的文本集作为第一训练样本集;将所述第一训练样本集的标签信息去除,作为第二训练样本集;
步骤B20,采用步骤S20方法获取所述第一训练样本集对应的第一词向量特征矩阵集、第二训练样本集对应的第二词向量特征矩阵集;
步骤B30,将所述第一词向量特征矩阵集与标签向量集合并为第一特征表示集,基于所述第一特征表示集、第二词向量特征矩阵集,采用步骤S30方法获取对应的标准知识向量集、无标签信息标准知识向量集;
步骤B40,基于随机一组标准知识向量以及对应的无标签信息标准知识向量,采用判别器识别标准知识向量和无标签信息标准知识向量的差异值,并通过对抗模仿学习更新编码器参数;
步骤B50,重复执行步骤B40直至所述标准知识向量和无标签信息标准知识向量的差异值低于预设阈值,获得训练好的向量编码器。
2.根据权利要求1所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,步骤S30中“采用编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量”,其方法为:
其中,代表获得的输入信息对应的知识向量,为第i个词的注意力权重,hi为第i个词的编码器隐层表示,N代表输入信息长度。
3.根据权利要求2所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,所述注意力权重为:
其中,分别代表第i个、第j个词与候选触发词wt的语义相似度。
4.根据权利要求1所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,步骤S40中“基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率”,其方法为:
其中,out代表输入信息属于各事件类别的概率,softmax是归一化指数函数,W0和b0为预先设定的事件类型分类器参数,wt为输入信息中的当前候选触发词,代表wt的标准知识向量或无标签信息标准知识向量。
5.根据权利要求1所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,步骤B10中“将所述第一训练样本集的标签信息去除,作为第二训练样本集”,其方法为:
对所述第一训练样本集进行标签去除操作,去除实体类别、事件元素类别信息。
6.根据权利要求1所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,步骤B40中“采用判别器识别标准知识向量和无标签信息标准知识向量”,其方法为:
其中,Wh、bh、Wx、bx分别代表预先设定的判别器参数,σ代表logistic函数,wt代表当前候选触发词,代表wt的标准知识向量或无标签信息标准知识向量。
7.一种基于对抗模仿学习的事件识别及分类系统,其特征在于,包括输入模块、特征化模块、向量编码模块、事件类型分类模块、输出模块;
所述输入模块,配置为获取不含标准标注信息的句子作为输入信息并输入;
所述特征化模块,配置为对所述输入信息中每一个词进行特征化操作,获得对应的词向量集构成词向量特征矩阵;
所述向量编码模块,配置为采用向量编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量;
所述事件类型分类模块,配置为基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率;
所述输出模块,配置为以概率值最高的事件类别作为所述输入信息的事件类别并输出;
其中,所述向量编码器,其训练方法为:
步骤B10,获取含有标签向量的文本集作为第一训练样本集;将所述第一训练样本集的标签信息去除,作为第二训练样本集;
步骤B20,采用特征化模块获取所述第一训练样本集对应的第一词向量特征矩阵集、第二训练样本集对应的第二词向量特征矩阵集;
步骤B30,将所述第一词向量特征矩阵集与标签向量集合并为第一特征表示集,基于所述第一特征表示集、第二词向量特征矩阵集,采用向量编码模块获取对应的标准知识向量集、无标签信息标准知识向量集;
步骤B40,基于随机一组标准知识向量以及对应的无标签信息标准知识向量,采用判别器识别标准知识向量和无标签信息标准知识向量的差异值,并通过对抗模仿学习更新编码器参数;
步骤B50,重复执行步骤B40直至所述标准知识向量和无标签信息标准知识向量的差异值低于预设阈值,获得训练好的向量编码器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910440322.0/1.html,转载请声明来源钻瓜专利网。