[发明专利]无监督的多目标篇章级情感分类模型训练方法和装置有效
申请号: | 201911382926.0 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111143564B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 刘昊;何伯磊;肖欣延 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/289;G06F40/216;G06F18/214;G06F18/241 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 戎郑华 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监督 多目标 篇章 情感 分类 模型 训练 方法 装置 | ||
1.一种无监督的多目标篇章级情感分类模型训练方法,其特征在于,包括:
利用预设的编码器将训练样本集中每个篇章样本进行编码处理,确定每个篇章样本对应的隐状态向量,其中,所述训练样本集中包括多个篇章样本及每个篇章样本对应的标注情感概率分布;
根据每个篇章样本中包括的待评价目标及各待评价目标对应的预设的权重矩阵,计算每个篇章样本中每个待评价目标对应的注意力值;
利用预设的解码器,对每个篇章样本对应的隐状态向量及每个篇章样本中每个待评价目标对应的注意力值进行解码处理,确定每个篇章样本中每个待评价目标对应的情感概率分布;
根据每个篇章样本中每个待评价目标对应的情感概率分布,确定每个篇章样本对应的预测情感概率分布;
根据每个篇章样本对应的预测情感概率分布与对应的标注情感概率分布的差异,对所述预设的编码器、各待评价目标对应的预设的权重矩阵及预设的解码器进行更新;
所述计算每个篇章样本中每个待评价目标对应的注意力值之前,还包括:
确定篇章样本中各分词与该篇章样本中包含的待评价目标对应的各种子词间的距离,其中,所述待评价目标对应的种子词,与所述待评价目标对应的候选词典中的候选词的匹配度大于阈值;
根据每个分词与所述待评价目标对应的各种子词间的距离,对所述待评价目标对应的预设的权重矩阵中每个分词对应的权重值进行修正。
2.如权利要求1所述的方法,其特征在于,所述计算每个篇章样本中每个待评价目标对应的注意力值之前,还包括:
根据每个篇章样本中每个分词与每个待评价目标对应的候选词典中各候选词的匹配度,确定每个篇章样本中包括的待评价目标。
3.如权利要求1所述的方法,其特征在于,所述计算每个篇章样本中每个待评价目标对应的注意力值之前,还包括:
对每个篇章样本中各子句进行语义识别,确定每个篇章样本中包括的待评价目标。
4.如权利要求1-3任一所述的方法,其特征在于,所述根据每个篇章样本中每个待评价目标对应的情感概率分布,确定每个篇章样本对应的预测情感概率分布,包括:
根据每个篇章样本中每个待评价目标在每种情感中的分布概率均值,确定该篇章样本在每种情感中的分布概率。
5.如权利要求1-3任一所述的方法,其特征在于,所述根据每个篇章样本中每个待评价目标对应的情感概率分布,确定每个篇章样本对应的预测情感概率分布,包括:
根据每个篇章样本中每个待评价目标在每种情感中的分布概率、及每个待评价目标的权重,确定该篇章样本在每种情感中的分布概率。
6.一种无监督的多目标篇章级情感分类模型训练装置,其特征在于,包括:
第一确定模块,用于利用预设的编码器将训练样本集中每个篇章样本进行编码处理,确定每个篇章样本对应的隐状态向量,其中,所述训练样本集中包括多个篇章样本及每个篇章样本对应的标注情感概率分布;
计算模块,用于根据每个篇章样本中包括的待评价目标及各待评价目标对应的预设的权重矩阵,计算每个篇章样本中每个待评价目标对应的注意力值;
第二确定模块,用于利用预设的解码器,对每个篇章样本对应的隐状态向量及每个篇章样本中每个待评价目标对应的注意力值进行解码处理,确定每个篇章样本中每个待评价目标对应的情感概率分布;
第三确定模块,用于根据每个篇章样本中每个待评价目标对应的情感概率分布,确定每个篇章样本对应的预测情感概率分布;
更新模块,用于根据每个篇章样本对应的预测情感概率分布与对应的标注情感概率分布的差异,对所述预设的编码器、各待评价目标对应的预设的权重矩阵及预设的解码器进行更新;
第六确定模块,用于确定篇章样本中各分词与所述待评价目标对应的各种子词间的距离,其中,所述待评价目标对应的种子词,与所述待评价目标对应的候选词典中的候选词的匹配度大于阈值;
修正模块,用于根据每个分词与所述待评价目标对应的各种子词间的距离,对所述待评价目标对应的预设的权重矩阵中每个分词对应的权重值进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911382926.0/1.html,转载请声明来源钻瓜专利网。