[发明专利]基于依存句法的交互注意力情感分析方法在审
申请号: | 201811333864.X | 申请日: | 2018-11-09 |
公开(公告)号: | CN109582764A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 钟建;王家乾;薛云;蔡倩华 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 江裕强 |
地址: | 510006 广东省广州市番禺区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感分析 注意力 句法 商品评价信息 依存句法分析 购买商品 简单方式 目标集合 情感极性 情感倾向 商品评论 文本评论 现实意义 原始句子 细粒度 准确率 拼接 信息量 句子 挖掘 评论 分析 服务 | ||
1.基于依存句法的交互注意力情感分析方法,其特征在于,包括以下步骤:
步骤一、获取电商行业中商品的原始评论数据;
步骤二、利用预训练好的GloVe词向量对步骤一获取的原始评论数据中单词和目标词进行初始词向量构建;
步骤三、利用长短时记忆网络LSTM(Long short-term memory)来捕获步骤二得到的句子的单词初始词向量的语义表征,得到的隐藏层输出作为句子的初始语义表达;
步骤四、利用依存句法分析将语义相关但不与目标词相邻的单词直接联系起来,以找到目标词的依存信息,并筛选出含有情感的依存信息,再与步骤二得到的目标词初始词向量融合为目标集合,形成目标的初始特征表示;
步骤五、再利用交互注意力分别提取步骤三得到的句子的初始语义表达和步骤四得到的目标的初始特征表示的特征向量表示,从而完整捕捉到句子和目标中的情感信息;
步骤六、融合步骤五得到的句子与目标中的特征向量表示,同时考虑步骤三中LSTM隐藏层最后状态的输出hN,形成最终的特征表示;
步骤七、将步骤六得到的最终的特征表示输入到归一化函数softmax分类层,并计算该句子在不同类别上的概率分布,以进行情感极性预测,概率最大的情感类别将作为最终的分类结果;所述不同类别包括积极、中性和消极的情感类别。
2.根据权利要求1所述的基于依存句法的交互注意力情感分析方法,其特征在于,步骤一中,每条原始评论数据由句子和目标共同组成,句子的情感极性包含了积极、消极、中性三个类别。
3.根据权利要求1所述的基于依存句法的交互注意力情感分析方法,其特征在于,步骤一中,将获取的评论数据分为笔记本电脑评论数据的训练集LPT-TR,笔记本电脑评论数据的测试集LPT-TE,餐厅评论数据的训练集RST-TR和餐厅评论数据的测试集RST-TE这4组数据集。
4.根据权利要求1所述的基于依存句法和交互注意力的情感分析方法,其特征在于,所述步骤二具体包括:
采用预训练好的GloVe词向量对步骤一获取的原始评论数据中单词和目标词进行初始词向量构建,词向量维度为300;权重参数初始值由均匀分布产生;隐藏层大小设置为300;优化算法AdaGard对应的初始学习速率设置为0.01;同时为了防止过拟合,正则项的权重设置为0.001。
5.根据权利要求1所述的基于依存句法和交互注意力的情感分析方法,其特征在于,所述步骤三具体包括:
LSTM中分别设计了输入门、遗忘门、输出门来控制句子信息的流入和流出;采用LSTM对句子进行建模,将步骤二得到的句子中所有单词对应的初始词向量输入到LSTM,得到隐藏层H输出结果H=[h1,h2,…,hN],其中dD为隐藏层的大小,N为给定句子的长度,R为参数空间,hN为第N个词的输出状态;将所得到的隐藏层输出H=[h1,h2,…,hN]作为句子的初始特征表示,从而捕获到句子中单词的语义表征,得到的隐藏层输出作为句子的初始语义表达。
6.根据权利要求1所述的基于依存句法和交互注意力的情感分析方法,其特征在于,所述步骤四具体包括:
依存句法是为了表示句子中词语之间的依存关系,能将语义相关但不与目标词相邻的单词直接联系起来,以找到目标词的依存信息,并筛选出含有情感的依存信息,再与步骤二得到的目标词初始词向量融合为目标集合,形成目标的初始特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811333864.X/1.html,转载请声明来源钻瓜专利网。