[发明专利]无监督的多目标篇章级情感分类模型训练方法和装置有效
申请号: | 201911382926.0 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111143564B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 刘昊;何伯磊;肖欣延 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/289;G06F40/216;G06F18/214;G06F18/241 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 戎郑华 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监督 多目标 篇章 情感 分类 模型 训练 方法 装置 | ||
本申请公开了无监督的多目标篇章级情感分类模型训练方法和装置,涉及NLP领域,方法包括:利用预设的编码器确定训练样本集中每个篇章样本对应的隐状态向量,每个篇章样本具有对应的标注情感概率分布;根据每个篇章样本中的待评价目标及各待评价目标对应的预设的权重矩阵,计算每个待评价目标对应的注意力值;利用预设的解码器,对每个篇章样本对应的隐状态向量及注意力值进行解码处理,确定每个待评价目标的情感概率分布,并依此确定每个篇章样本的预测情感概率分布;根据每个篇章样本的预测情感概率分布与标注情感概率分布的差异,对预设的编码器、各预设的权重矩阵及预设的解码器进行更新。基于篇章级的情感标注数据训练模型,成本低,实用性高。
技术领域
本申请涉及计算机技术领域,具体涉及自然语言处理(Natural LanguageProcessing,NLP)技术领域,尤其涉及一种无监督的多目标篇章级情感分类模型训练方法和装置。
背景技术
目前多目标篇章级情感分析方法,多是基于有监督的深度学习实现的。这这种方法需要将标注好的篇章文本中各评价目标的情感极性作为训练数据进行模型训练。
但是,由于篇章文本中各评价目标的情感极性标注过程需要大量的人力和物力,从而使得该分析方法的成本太高,实用性较差。
发明内容
本申请提出一种无监督的多目标篇章级情感分类模型训练方法和装置,用于解决相关技术中,用于基于有监督的深度学习进行多目标篇章级情感分析,成本较高,实用性差的问题。
本申请一方面实施例提出了一种无监督的多目标篇章级情感分类模型训练方法,包括:
利用预设的编码器将训练样本集中每个篇章样本进行编码处理,确定每个篇章样本对应的隐状态向量,其中,所述训练样本集中包括多个篇章样本及每个篇章样本对应的标注情感概率分布;
根据每个篇章样本中包括的待评价目标及各待评价目标对应的预设的权重矩阵,计算每个篇章样本中每个待评价目标对应的注意力值;
利用预设的解码器,对每个篇章样本对应的隐状态向量及每个篇章样本中每个待评价目标对应的注意力值进行解码处理,确定每个篇章样本中每个待评价目标对应的情感概率分布;
根据每个篇章样本中每个待评价目标对应的情感概率分布,确定每个篇章样本对应的预测情感概率分布;
根据每个篇章样本对应的预测情感概率分布与对应的标注情感概率分布的差异,对所述预设的编码器、各待评价目标对应的预设的权重矩阵及预设的解码器进行更新。
本申请实施例的无监督的多目标篇章级情感分类模型训练方法,通过利用预设的编码器将训练样本集中每个篇章样本进行编码处理,确定每个篇章样本对应的隐状态向量,其中,训练样本集中包括多个篇章样本及每个篇章样本对应的标注情感概率分布;然后根据每个篇章样本中包括的待评价目标及各待评价目标对应的预设的权重矩阵,计算每个篇章样本中每个待评价目标对应的注意力值;之后利用预设的解码器,对每个篇章样本对应的隐状态向量及每个篇章样本中每个待评价目标对应的注意力值进行解码处理,确定每个篇章样本中每个待评价目标对应的情感概率分布;之后根据每个篇章样本中每个待评价目标对应的情感概率分布,确定每个篇章样本对应的预测情感概率分布;再根据每个篇章样本对应的预测情感概率分布与对应的标注情感概率分布的差异,对预设的编码器、各待评价目标对应的预设的权重矩阵及预设的解码器进行更新。由此,通过基于篇章级的情感标注数据作为训练数据,可以训练得到识别篇章级中各目标的情感极性的模型,无需人工标注各篇章样本中每个评价目标的情感极性,降低了多目标篇章级情感分类的成本,实用性高。
本申请另一方面实施例提出了一种无监督的多目标篇章级情感分类模型训练装置,包括:
第一确定模块,用于利用预设的编码器将训练样本集中每个篇章样本进行编码处理,确定每个篇章样本对应的隐状态向量,其中,所述训练样本集中包括多个篇章样本及每个篇章样本对应的标注情感概率分布;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911382926.0/2.html,转载请声明来源钻瓜专利网。