[发明专利]一种基于对抗训练机制的多语言实体关系抽取方法及系统有效
申请号: | 201810827459.7 | 申请日: | 2018-07-25 |
公开(公告)号: | CN110852066B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 刘知远;王晓智;韩旭;林衍凯;孙茂松 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06N5/02;G06N3/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 训练 机制 语言 实体 关系 抽取 方法 系统 | ||
1.一种基于对抗训练机制的多语言实体关系抽取方法,其特征在于,包括:
对于多种语言中的任意一种语言,在该语言中获取预设数量的与目标实体对相关的句子,作为目标句子,并构建每个目标句子在该语言对应的独立语义空间中的第一句子向量表示以及在一致性语义空间中的第二句子向量表示;
预设多个关系类型,对于任意一个关系类型,构建该关系类型在该语言对应的独立语义空间中的第一关系向量表示,根据第一关系向量表示和该语言中所有目标句子的第一句子向量表示获得目标实体对相对该关系类型在该语言对应的独立语义空间中的第一全局向量表示;
构建该关系类型在一致性语义空间中的第二关系向量表示,根据第二关系向量表示和所有语言中所有目标句子的第二句子向量表示获得目标实体对相对该关系类型在一致性语义空间中的第二全局向量表示;
基于第二全局向量表示和目标实体对相对该关系类型在各语言对应的独立语义空间中的第一全局向量表示获得该关系类型对应的全局概率,从各关系类型对应的全局概率中选取出最大概率,根据最大概率对应的关系类型预测目标实体对之间的关系;
所述构建每个目标句子在一致性语义空间中的第二句子向量表示,具体为:
对于任意一个目标句子,获取该目标句子中的所有单词,将所有单词输入至预先训练好的一致性语义空间的编码器的输入层,获得每个单词对应的第二表示向量;
将所有单词对应的第二表示向量进行组合,获得第二表示向量序列,将第二表示向量序列输入至一致性语义空间的编码器的核心处理层,获得该目标句子在一致性语义空间中的第二句子向量表示;
其中,第二表示向量包括词向量和位置向量。
2.根据权利要求1所述的方法,其特征在于,构建每个目标句子在该语言对应的独立语义空间中的第一句子向量表示,具体为:
对于任意一个目标句子,获取该目标句子中的所有单词,将所有单词输入至预先训练好的独立语义空间的编码器的输入层,获得每个单词对应的第一表示向量;
将所有单词对应的第一表示向量进行组合,获得第一表示向量序列,将第一表示向量序列输入至独立语义空间的编码器的核心处理层,获得该目标句子在该语言对应的独立语义空间中的第一句子向量表示;
其中,第一表示向量包括词向量和位置向量。
3.根据权利要求1所述的方法,其特征在于,根据第一关系向量表示和该语言中所有目标句子的第一句子向量表示获得目标实体对相对该关系类型在该语言对应的独立语义空间中的第一全局向量表示,具体计算公式为:
其中,sj为目标实体对相对关系类型r在语言j对应的独立语义空间中的第一全局向量表示;为目标句子i相对关系类型r在语言j对应的独立语义空间中的注意力权重,rj为关系类型r在语言j对应的独立语义空间中的第一关系向量表示,为目标句子i在语言j对应的独立语义空间中第一句子向量表示,k为语言j中的任意一个目标句子,m为语言j中所有目标句子的总数量。
4.根据权利要求1所述的方法,其特征在于,根据第二关系向量表示和所有语言中所有目标句子的第二句子向量表示获得目标实体对相对该关系类型在一致性语义空间中的第二全局向量表示,具体计算公式为:
其中,为目标实体相对关系类型r在一致性语义空间中的第二全局向量表示;为语言j中目标句子i相对关系类型r在一致性语义空间中的注意力权重,为关系类型r在一致性语义空间中的第二关系向量表示,为语言j中目标句子i在一致性语义空间中的第二句子向量表示,l为多种语言中的任意一种语言,k为语言l中的任意一个目标句子,m为语言l中所有目标句子的总数量,n为所有语言的种类总数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810827459.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:USB接口连接装置
- 下一篇:目标语句提取方法、问题生成方法以及信息处理设备