[发明专利]一种情感增强的细粒度情感预测方法、装置、系统及存储介质有效
申请号: | 202010168893.6 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111475615B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 徐睿峰;梁斌;毛瑞彬;张俊;杨敏;杜嘉晨;范创 | 申请(专利权)人: | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F18/214;G06Q50/00 |
代理公司: | 深圳市添源创鑫知识产权代理有限公司 44855 | 代理人: | 周椿 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情感 增强 细粒度 预测 方法 装置 系统 存储 介质 | ||
本发明提供了一种情感增强的细粒度情感预测方法,包括执行以下步骤:步骤1:根据方面词语或属性的特性对数据进行扩建;步骤2:结合对抗训练构造细粒度情感分析对抗网络模型,并且通过共享特征提取器提取所有训练样本的共通情感特征;步骤3:将提取到的共通情感特征和特定方面的情感特征相结合来构造对抗训练多任务学习网络框架,协助模型对数据样本缺乏文本进行细粒度情感识别。本发明的有益效果是:1.本发明所提出的对抗训练多任务学习框架能通过特征提取器和判别器共同学习提取到的共享特征来协助细粒度情感分类模型对输入文本进行细粒度情感预测;2.本发明基于这种对抗训练和多任务学习方法,可以增强数据集不同方面的情感特征表示。
技术领域
本发明涉及互联网技术领域,尤其涉及一种情感增强的细粒度情感预测方法、装置、系统及存储介质。
背景技术
随着社交网络平台的迅速发展,传统的简单情感分析已无法有效获取用户评论中的情感信息表达。细粒度情感分析需要针对文本中特定的方面(Aspect)进行情感预测,这不仅需要考虑给定文本的信息同时也要考虑文本所对应的不同方面。如在用户评论中,用户会从不同方面出发来发表意见,对事物进行更深层次的情感表述。
然而,在现实的用户评论中,用户对不同方面的情感表达往往是有偏向性和针对性的。这种偏向性的情感表达会导致用户评论在方面层面上的数据分布不平衡问题,即某些方面的情感表达数据量在用户评论中会非常有限和缺乏。此外,由于情感表述的共通性,一些情感表达在修饰不同方面时的情感极性是一致的。例如句子“Decent wine atreasonable prices”和“Decent food at reasonable prices”,对于方面“wine”和“food”的情感极性都是积极的。
近年来,随着深度网络模型在自然语言处理领域取得的突破,结合注意力机制(Attention Mechanism)的深度网络模型在细粒度情感分析任务中也取得了先进的效果。现有的基于深度网络的细粒度情感分析模型主要是以文本和特定方面作为网络的输入,并通过抽象化表示的一系列运算来提取特定方面在情感特征。此外,结合注意力机制的深度网络模型可以根据注意力信息的学习和更新能挖掘出文本中针对某一方面的情感特征表达,得到细粒度情感预测结果。但是这类方法只针对独立的样本进行情感特征提取和细粒度情感分析,它们的缺点在于:
1.在细粒度情感分析任务中,只对独立样本进行情感极性预测,忽视了不用方面之间的情感联系;
2.由于方面级别的样本分布不平衡和样本缺失等问题,训练集样本无法有效覆盖测试集样本,以往的模型无法通过有限的训练数据对测试样例进行细粒度情感分析;
在对方面进行情感预测时,忽视了共通情感特征的提取和使用。
发明内容
本发明提供了一种情感增强的细粒度情感预测方法,包括执行以下步骤:
步骤1:根据方面词语或属性的特性对数据进行扩建;
步骤2:结合对抗训练构造细粒度情感分析对抗网络模型,并且通过共享特征提取器提取所有训练样本的共通情感特征;
步骤3:将提取到的共通情感特征和特定方面的情感特征相结合来构造对抗训练多任务学习网络框架,协助模型对数据样本缺乏文本进行细粒度情感识别。
作为本发明的进一步改进,在所述步骤1中还包括执行以下步骤:第1步骤:统计每一个方面的训练样本数量,并且计算出平均数;
第2步骤:将类似的方面进行分组保存;
第3步骤:在每一组的方面样本中,随机从样本数量大于平均数的方面样本中抽取足量的样本,并且将样本涉及的方面替换成方面样本少于平均数的方面,直到该方面的训练样本量达到平均数。
作为本发明的进一步改进,在所述步骤2中,还包括执行以下步骤:第一步骤:特征提取器F接收文本的词向量矩阵作为模型的输入,并提取特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),未经哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010168893.6/2.html,转载请声明来源钻瓜专利网。