[发明专利]一种基于多通道模型的特定目标情感分析方法有效
申请号: | 201811291881.1 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109408823B | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 袁婷;黎海辉;薛云;胡晓晖 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35;G06Q30/02 |
代理公司: | 广州市科丰知识产权代理事务所(普通合伙) 44467 | 代理人: | 王海曼 |
地址: | 510000 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注意力机制 情感分析 预处理 情感分类 测试集 多通道 目标词 数据集 向量 自然语言处理技术 分类准确率 方法设置 分类结果 获取目标 欧式距离 评论文本 情感计算 特征提取 训练集 池化 分层 标签 测试 学习 | ||
1.一种基于多通道模型的特定目标情感分析方法,其特征在于,包括以下步骤:
(1)输入评测数据集,对评测数据集进行预处理,并划分为训练集、测试集;
(2)分别输入到三个通道进行特征提取,以获得向量r1、r2、r3、r4和r5;
(3)利用向量r1、r2、r3、r4和r5,通过注意力机制的学习,得到分类结果;
(4)用训练好的模型对测试集中每个评论文本的特定目标进行情感分类,并与测试集本身的标签对比,计算分类准确率;
步骤(2)所述的三个通道进行特征提取获得向量r1、r2、r3、r4、r5具体为:
(2-1)第一个通道是将上下文表示Wc与目标词表示Wt进行直接拼接,得到矩阵W1,tc,其中m,n分别是目标词和上下文中词的个数,dc是词向量维度,将W1,tc通过LSTM得到隐含状态H1,tc,其中d为LSTM隐藏层的维度,然后对H1,tc进行分层池化操作得到向量r1,
(2-2)第二个通道是将Wt与Wc分别输入到LSTM,得到目标词和上下文的隐含状态H2,t和H2,c,将H2,t和H2,c分别进行平均池化,得到目标词和上下文的平均池化向量t2,avg和c2,avg,其中然后引入交互注意力机制,使目标信息与上下文信息充分交互,得到向量r3,
(2-3)第三个通道将Wt与Wc分别输入到LSTM,得到目标词和上下文对应的隐含状态与其中引入基于欧式距离的注意力机制,充分利用语义信息,得到注意力机制权重矩阵H3,tc,其中通过H3,tc的转置与相乘得到H3,tc与相乘得到其中为上下文对目标词的基于欧式距离注意力机制后的表示,为目标词对上下文的基于欧式距离注意力机制后的表示,将和输入到LSTM,得到输出和其中将进行平均池化得到t3,avg和c3,avg,其中引入交互注意力机制后,得到向量r4与r5,其中
2.根据权利要求1所述的一种基于多通道模型的特定目标情感分析方法,其特征在于,步骤(1)具体是:对特定目标情感分析的测评数据进行预处理,包括获得评论文本、特定目标及其情感极性,然后按3:1的比例将测评数据随机划分成训练集和测试集,且保证两者中积极和消极的评论数基本平衡。
3.根据权利要求1所述的一种基于多通道模型的特定目标情感分析方法,其特征在于,步骤(3)具体为:利用向量r1、r2、r3、r4和r5,通过注意力机制的学习,得到最终表示r,最后将r输入到全连接神经网络当中,激活函数为softmax,得到最终的输出y,其中C为分类的类数;d为LSTM隐藏层的维度。
4.根据权利要求1所述的一种基于多通道模型的特定目标情感分析方法,其特征在于,步骤(4)具体为:利用训练集训练得到模型结构参数后,便对测试集进行预测,并求出分类准确率。
5.根据权利要求3所述的一种基于多通道模型的特定目标情感分析方法,其特征在于,步骤(2-1)所述的分层池化操作是先进行平均池化,再进行最大池化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811291881.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种跨语言图书相关度分析方法及系统
- 下一篇:用于生成信息的方法和装置