[发明专利]文本关系抽取模型的训练方法、装置以及计算机设备有效
申请号: | 202110610936.6 | 申请日: | 2021-06-01 |
公开(公告)号: | CN113282710B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 孙思;曹锋铭 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/284;G06N3/04;G06N3/08 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 关系 抽取 模型 训练 方法 装置 以及 计算机 设备 | ||
1.一种文本关系抽取模型的训练方法,其特征在于,包括:
获取训练文本以及所述训练文本对应的词汇关系表格;
按照预设的向量化方式对所述训练文本中的各个词进行向量化,得到各个词对应的词向量;
将所有的所述词向量通过输入通道输入迭代通道中进行迭代交叉训练,得到语法输出结果和情感输出结果;其中,所述迭代通道中语法线程和情感线程的训练层一一交替,所述迭代通道内的当前训练层的输出作为其后两层训练层的输入,第一训练层和第二训练层为直接输入所述训练文本进行计算,倒数第二层的输出作为倒数第一层的输入,所述倒数第一层和所述倒数第二层的输出结果分别为所述语法输出结果,以及所述情感输出结果,所述当前训练层不包括所述倒数第一层和所述倒数第二层;
根据所述词汇关系表格、所述语法输出结果,以及所述情感输出结果,调整所述语法线程和情感线程中的参数,反复在所述迭代通道内进行迭代交叉训练,直至所述迭代交叉训练的损失值小于预设损失值,以得到所述文本关系抽取模型,包括:根据所述词汇关系表格、所述语法输出结果,以及所述情感输出结果计算第一任务完成后的,所述语法线程的第一损失值,和所述情感线程第二损失值;所述第一任务为一次所述迭代交叉训练的任务;判断所述第一任务的第一损失值和所述第二损失值是否均小于预设损失值;若否,则根据所述词汇关系表格、所述语法输出结果,以及所述情感输出结果,调整所述语法线程和情感线程中的参数;根据第一参数和第二参数开启第二任务,所述第一参数为执行所述第一任务后所述语法线程的参数,所述第二参数为执行所述第一任务后所述情感线程的参数,并计算所述第二任务对应的第一损失值和第二损失值;所述第二任务为又一次所述迭代交叉训练的任务;判断所述第二任务的第一损失值和第二损失值是否均小于所述预设损失值;若是,则得到所述文本关系抽取模型。
2.如权利要求1所述的文本关系抽取模型的训练方法,其特征在于,所述按照预设的向量化方式对所述训练文本中的各个词进行向量化,得到各个词对应的词向量的步骤中,第一词汇的向量化的步骤包括:
基于lstm的char编码、lstm的word编码以及bert的char编码分别对所述第一词汇进行编码,对应得到第一编码、第二编码和第三编码;其中,所述第一词汇为所述训练文本中的任意一个词汇;
将所述第一编码、所述第二编码和所述第三编码按照顺序拼接,得到所述第一词汇对应的词向量。
3.如权利要求1所述的文本关系抽取模型的训练方法,其特征在于,所述将所有的所述词向量通过输入通道输入迭代通道中进行迭代交叉训练,得到语法输出结果和情感输出结果的步骤中,在所述情感线程的训练中非第一层和第二层的训练步骤包括:
获取上一层训练层中所述语法线程的第一输出结果,以及获取上两层的第二输出结果;
根据公式Sl=LayerNorm(Sl-1+TableGuideAttn(Sl-1))进行迭代交叉训练,其中,Sl-1表示所述第二输出结果,TableGuideAttn表示所述第一输出结果,Sl表示当前训练层的输出结果,LayerNorm表示进行归一化处理。
4.如权利要求1所述的文本关系抽取模型的训练方法,其特征在于,所述将所有的所述词向量通过输入通道输入迭代通道中进行迭代交叉训练,得到语法输出结果和情感输出结果的步骤中,在所述语法线程的训练中非第一层和第二层的训练步骤包括:
获取上一步训练层中所述情感线程的第三输出结果,以及获取上两步的第四输出结果;
根据公式Tm,i,j=GRU(Xm,i,j,Tm-1,i,j,Tm,i-1,j,Tm,i,j-1)进行迭代交叉训练,其中Xm,i,j=ReLU(Linear([Sm-1,i;Sm-1,j])),其中,Tm,i,j表示第m层对第i个字和第j个字的交互。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110610936.6/1.html,转载请声明来源钻瓜专利网。