[发明专利]融合词典与对抗迁移的越南语事件实体识别方法有效
申请号: | 202110164070.0 | 申请日: | 2021-02-05 |
公开(公告)号: | CN112926324B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 余正涛;薛振宇;线岩团;相艳;王红斌 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/216;G06F40/242;G06F40/47;G06F40/30;G06N3/04;G06N3/08;G06F16/35 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 词典 对抗 迁移 越南语 事件 实体 识别 方法 | ||
1.融合词典与对抗迁移的越南语事件实体识别方法,其特征在于:首先利用词级别对抗迁移实现源语言与目标语言的语义空间共享,再融合双语词典进行多粒度特征嵌入以丰富目标语言词的语义表征,之后使用句子级别对抗迁移提取到与语言无关的序列特征,最后通过CRF标注出实体识别结果;
所述方法包括:
Step1、在词级对抗迁移训练过程中令线性映射层与词级鉴别器相互对抗混淆以使得线性映射层不断优化;
Step2、提取并融合目标语言句子中的目标语言词级特征、目标语言字符级特征与通过双语词典找到的对应源语言词级特征;提取并融合源语言句子中的源语言词级特征、源语言字符级特征与该句子通过优化后的线性映射层后的源语言词级特征;
Step3、在句子级对抗迁移训练过程中令多头注意力特征共享编码器与句子级鉴别器相互对抗混淆以使得共享编码器不断优化,从而使得多头注意力特征共享编码器提取到与语言无关的序列特征信息;
Step4、将与语言无关的序列特征信息输入多头注意力上下文编码器中提取全局信息,衡量每个词在整个句子中的重要性程度,进而通过CRF对整个句子的输出进行联合建模。
2.根据权利要求1所述的融合词典与对抗迁移的越南语事件实体识别方法,其特征在于:所述Step1的具体步骤为:
Step1.1、在得到预训练好的目标语言词向量与预训练好的源语言词向量的情况下,使用一个线性映射函数f将源语言映射到目标语言空间中,使用一个多层感知器D作为词级鉴别器,线性映射函数f与词级鉴别器在训练过程中互相对抗混淆对方,通过最小化交叉熵损失函数来训练线性映射函数f,使得线性映射函数f的参数趋于最优。
3.根据权利要求1所述的融合词典与对抗迁移的越南语事件实体识别方法,其特征在于:所述Step2的具体步骤:
Step2.1、使用预训练好的目标语言词向量与预训练好的源语言词向量将目标语言句子表示与源语言句子表示中的每一个词初始化为词向量,得到目标语言句子中的目标语言词级特征与源语言句子中的源语言词级特征;将每一个目标语言词与源语言词分别随机初始化为字符向量后使用CNN来提取字符向量的特征;
Step2.2、对于目标语言句子而言:如果目标语言句子中的一个词通过双语词典能找到对应的源语言翻译词组,则利用注意力机制强化与目标语言词的词义相接近的源语言翻译词的权重,从而提取源语言词级特征;若通过双语词典未能找到对应的源语言翻译词组,则利用一个线性映射函数将目标语言句子中的词转换到源语言语义空间上,将转换后得到的词视作该目标语言词对应的源语言翻译词,进而提取源语言词级特征;对于源语言句子而言:将源语言句子通过优化后的线性映射函数f后,得到映射后的源语言词级特征;
Step2.3、在得到目标语言字符特征、目标语言词特征和相应的源语言翻译词特征以及源语言字符特征、源语言词特征和相应的映射后源语言词特征之后,利用注意力的方式,在源语言句子端和目标语言句子端自适应的根据权重弱化或强化每个粒度的特征,从而实现将各个粒度的特征融合在一起。
4.根据权利要求1所述的融合词典与对抗迁移的越南语事件实体识别方法,其特征在于:所述Step3的具体步骤为:
Step3.1、在得到融合多粒度特征后的目标语言句子表示与源语言句子表示之后,使用多头注意力作为特征共享编码器来对这两种句子分别提取句子级特征;使用句子级鉴别器预测输入模型的一个句子是否来自目标语言或源语言,特征共享编码器与句子级鉴别器在训练过程中互相对抗混淆对方以使得特征共享编码器不断优化,从而使得特征共享编码器提取到与语言无关的序列特征信息。
5.根据权利要求1所述的融合词典与对抗迁移的越南语事件实体识别方法,其特征在于:所述Step4的具体步骤为:
Step4.1、在特征共享编码器提取到与语言无关的序列特征之后,将得到的特征送入基于多头注意力的上下文编码器中来重新捕获每个词的上下文语义依赖关系,然后使用CRF作为最后的输出层,给每个事件实体打上预测的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110164070.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种SOC估算方法
- 下一篇:一种柔性防火矿物绝缘电缆及其制备方法