[发明专利]基于强化学习的关系抽取方法和装置在审
申请号: | 201810003062.6 | 申请日: | 2018-01-02 |
公开(公告)号: | CN108280058A | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 何世柱;刘康;赵军;曾祥荣 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 郭文浩;陈晓鹏 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 句子 关系抽取 强化学习 向量表示 方法和装置 监督数据 位置向量 预设关系 抽取器 词向量 自然语言处理技术 卷积神经网络 神经网络构建 映射向量 分类器 池化 监督 | ||
1.一种基于强化学习的关系抽取方法,其特征在于,所述方法包括:
步骤S100,获取句子中各词的词向量和各词的位置向量;
步骤S200,依据所获取的各词的词向量和各词的位置向量,利用预设关系抽取器获取句子的关系类别;
其中,所述预设关系抽取器为基于神经网络构建的模型,所述预设关系抽取器包括向量表示层、卷积神经网络层、池化层和分类器层;
所述向量表示层,用于将所述各词的词向量和各词的位置向量进行拼接,获取各词对应的词的向量表示;
所述卷积神经网络层,用于依据所述向量表示层所获取的词的向量表示,获取特征映射向量;
所述池化层,用于依据所述卷积神经网络层所获取的特征映射向量,获取初步句子的向量表示,并将其与词的位置向量拼接,获取最终句子的向量表示;
所述分类器层,用于依据所述池化层所获取的最终句子的向量表示,获取句子关系类别概率值,并将所获取的句子关系类别概率值最大的关系类别作为句子的关系类别。
2.根据权利要求1所述的基于强化学习的关系抽取方法,其特征在于,“获取句子中各词的词向量和各词的位置向量”的步骤具体包括:
步骤S110,利用分词工具获取句子中的词序列,并利用词向量工具获取所述词序列中各词对应的词向量;
步骤S120,获取句子中各词的位置向量。
3.根据权利要求1所述的基于强化学习的关系抽取方法,其特征在于,所述预设关系抽取器,其训练优化方法包括:
步骤A1,使用弱监督方法处理预设的训练集;
步骤A2,依据所述弱监督方法处理后的数据,利用预设关系抽取器,依次预测包中各句子的关系类别;
步骤A3,依据所预测的各句子的关系类别和预设规则预测所述包的关系类别;
步骤A4,依据预设奖赏值规则和所预测的包的关系类别与真实的包的关系类别,获取奖赏值;
步骤A5,依据所得到的奖赏值,采用有基线的REINFORCE算法训练所述预设关系抽取器。
4.根据权利要求3所述的基于强化学习的关系抽取方法,其特征在于,所述预设规则为:
当包中所有的句子的预测关系类别为NA,则预测包的关系类别为NA;所述NA的类别表示为没有关系;
当所述包中有预测关系类别不为NA的句子时,将所述预测概率值最大的句子的预测关系类别作为包的关系类别。
5.根据权利要求3所述的基于强化学习的关系抽取方法,其特征在于,所述预设奖赏值规则为:
当所述预测的包的关系类别与真实的包的关系类别一致,则得到的奖赏值+1;否则得到的奖赏值-1。
6.一种基于强化学习的关系抽取装置,其特征在于,所述装置包括第一获取模块和第二获取模块;
所述第一获取模块,配置为获取句子中各词的词向量和各词的位置向量;
所述第二获取模块,配置为依据所述第一获取模块所获取的各词的词向量和各词的位置向量,利用预设关系抽取器获取句子的关系类别;
其中,所述预设关系抽取器为基于神经网络构建的模型,所述预设关系抽取器依次包括向量表示层、卷积神经网络层、池化层和分类器层;
所述向量表示层,用于将所述各词的词向量和各词的位置向量进行拼接,获取各词对应的词的向量表示;
所述卷积神经网络层,用于依据所述向量表示层所获取的词的向量表示,获取特征映射向量;
所述池化层,用于依据所述卷积神经网络层所获取的特征映射向量,获取初步句子的向量表示,并将其与词的位置向量拼接,获取最终句子的向量表示;
所述分类器层,用于依据所述池化层所获取的最终句子的向量表示,获取句子关系类别概率值,并将所获取的句子关系类别概率值最大的关系类别作为句子的关系类别。
7.根据权利要求6所述的基于强化学习的关系抽取装置,其特征在于,所述第一获取模块包括词向量获取单元和位置向量获取单元;
所述词向量获取单元,配置为利用分词工具获取句子中的词序列,并利用词向量工具获取所述词序列中各词对应的词向量;
所述位置向量获取单元,配置为获取句子中各词的位置向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810003062.6/1.html,转载请声明来源钻瓜专利网。