[发明专利]一种情感增强的细粒度情感预测方法、装置、系统及存储介质有效
申请号: | 202010168893.6 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111475615B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 徐睿峰;梁斌;毛瑞彬;张俊;杨敏;杜嘉晨;范创 | 申请(专利权)人: | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F18/214;G06Q50/00 |
代理公司: | 深圳市添源创鑫知识产权代理有限公司 44855 | 代理人: | 周椿 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情感 增强 细粒度 预测 方法 装置 系统 存储 介质 | ||
1.一种情感增强的细粒度情感预测方法,其特征在于,包括执行以下步骤:
步骤1:根据方面词语或属性的特性对数据进行扩建;
步骤2:结合对抗训练构造细粒度情感分析对抗网络模型,并且通过共享特征提取器提取所有训练样本的共通情感特征;
步骤3:将提取到的共通情感特征和特定方面的情感特征相结合来构造对抗训练多任务学习网络框架,协助模型对数据样本缺乏文本进行细粒度情感识别;
在所述步骤2中,还包括执行以下步骤:
第一步骤:特征提取器F接收文本的词向量矩阵作为模型的输入,并提取特征信息;
第二步骤:根据提取的特征信息同时判断该文本的方面标签和真假样本标签;
第三步骤:判别器D接收特征提取器F提取的共享特征对参数权重进行调整,同时对方面识别和真假样本识别的损失函数进行最小化优化:
这里,N为样本数量,A为方面标签数量,P为真假样本标签数,X为输入词向量矩阵,表示第i个样本中第j个方面标签的分布,表示第i个样本中第j个真假标签的分布,θd为特征提取器的所有参数,λ用来控制两部分损失的相互作用。
2.根据权利要求1所述的细粒度情感预测方法,其特征在于,在所述步骤1中还包括执行以下步骤:
第1步骤:统计每一个方面的训练样本数量,并且计算出平均数;
第2步骤:将类似的方面进行分组保存;
第3步骤:在每一组的方面样本中,随机从样本数量大于平均数的方面样本中抽取足量的样本,并且将样本涉及的方面替换成方面样本少于平均数的方面,直到该方面的训练样本量达到平均数。
3.根据权利要求1所述的细粒度情感预测方法,其特征在于,在所述步骤3中,还包括执行以下步骤:
步骤A:细粒度情感特征提取模型M通过接收文本的词向量矩阵输入以及特定方面的注意力信息输入来针对特定方面提取情感特征信息;
步骤B:将细粒度情感特征提取模型M提取到的特征和共享特征提取器F提取到的特征相结合作为分类器C的输入来预测情感极性;
步骤C:对抗多任务学习框架通过最小最大化损失函数优化同时学习多个任务的特征信息,协助模型完成细粒度情感预测,即在最小化细粒度情感预测损失的同时,最大化判别器D的损失函数;其中,对抗多任务学习框架需要通过所有参数权重Θ来最小化总损失函数,其计算公式如下:
J(Θ)=J(θc)+αJ(θd)
这里,α用来控制两部分损失函数的相互作用,J(θc)为情感分类器损失函数,其计算公式如下:
这里,S为情感标签数量,表示第i个样本中第j个情感标签分布,β用来控制两部分损失函数的相互作用。
4.一种情感增强的细粒度情感预测装置,其特征在于,该装置包括运行以下单元:
单元1:用于根据方面词语或属性的特性对数据进行扩建;
单元2:用于结合对抗训练构造细粒度情感分析对抗网络模型,并且通过共享特征提取器提取所有训练样本的共通情感特征;
单元3:用于将提取到的共通情感特征和特定方面的情感特征相结合来构造对抗训练多任务学习网络框架,协助模型对数据样本缺乏文本进行细粒度情感识别;
在所述单元2中,还包括运行以下模块:
第一模块:用于特征提取器F接收文本的词向量矩阵作为模型的输入,并提取特征信息;
第二模块:用于根据提取的特征信息同时判断该文本的方面标签和真假样本标签;
第三模块:用于判别器D接收特征提取器F提取的共享特征对参数权重进行调整,同时对方面识别和真假样本识别的损失函数进行最小化优化:
这里,N为样本数量,A为方面标签数量,P为真假样本标签数,X为输入词向量矩阵,表示第i个样本中第j个方面标签的分布,表示第i个样本中第j个真假标签的分布,θd为特征提取器的所有参数,λ用来控制两部分损失的相互作用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010168893.6/1.html,转载请声明来源钻瓜专利网。