[发明专利]利用高维表示提高特定属性情感分类准确率方法有效
申请号: | 201810754022.5 | 申请日: | 2018-07-10 |
公开(公告)号: | CN108984724B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 谢珏;吴含前;李露 | 申请(专利权)人: | 凯尔博特信息科技(昆山)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215300 江苏省苏州市昆山市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 表示 提高 特定 属性 情感 分类 准确率 方法 | ||
本发明公开了一种利用高维表示提高特定属性情感分类准确率方法,该方法从单词、子句及句子三个不同的维度,利用评论文本及其特定属性信息构建多层次、高维度的深度神经网络模型。首先本发明提出了一种子句切分的算法将评论文本切分成若干个子句;其次利用多个双向长短期记忆神经网络将每个子句中的单词进行编码,以此得到各子句的表示;最后采用一个双向长短期记忆神经网络对上一步中得到的各子句的表示进行编码以此来得到整个句子的最终表示。通过上述方法从单词、子句、句子三个不同的维度捕捉与特定属性更为相关的信息,最终提高特定属性的情感分类的准确率。
技术领域
本发明涉及评论文本表达的情感分析方法,具体的,其展示一种利用高维表示提高特定属性情感分类准确率方法。
背景技术
为了得到评论文本中各属性的情感极性,通过情感分析(SentimentAnalysis,SA)技术,将评论文本中的属性词、情感词、情感修饰词识别出来进行进一步的分析处理,以此来判断出针对特定属性该评论文本表达的情感极性,可将其应用于事件分析、网络舆情分析、垃圾邮件处理等领域。
传统的粗粒度情感分析方法在进行评论文本的情感极性判断时,仅仅是对评论文本整体进行分析处理,无法针对评论文本中的特定属性对其进行细粒度的极性判断。因此,近年来的对于情感分析的研究越来越趋向于细粒度,这也成为了国内外研究和关注的热点话题。
针对评论文本中特定属性进行情感极性判断是更细粒度的评论文本情感分析,当前已有利用深度神经网络(Deep Neural Network,DNN)技术对文本中的特定属性进行情感分析的研究,Tang等在“Target-dependent Sentiment Classification with Long Short-term Memory”中针对特定属性对句子进行情感分类的问题上提出了基于目标依赖的长短期记忆神经网络(Target-Dependent Long Short Term Memory,TD-LSTM)和基于目标关联的长短期记忆神经网络(Target-Connection Long Short Term Memory,TC- LSTM),其中TD-LSTM在生成句子表示时将目标信息考虑了进去,其次TC-LSTM在上述方法的基础上将目标信息及其上下文关联起来,该方法通过将目标短语中词向量的平均值作为目标向量,然而简单的平均目标短语中的词向量并不能完全表达出目标短语的语义,因此并不能得到最优结果。Dong等在“Adaptive Recursive Neural Network for Target-dependentTwitter Sentiment Classification”中针对依赖于特定属性的推文提出了一种自适应的递归神经网络(Adaptive Recursive Neural Network,AdaRNN)。根据情感词和特定属性之间的上下文内容和句法关系,自适应地将情感词传递给特定属性。该方法将句子的依存树转换成针对特定属性的递归结构,并基于该结构获得更高层的表示。实验研究表明,基于AdaRNN构建的分类器其分类性能优于传统的机器学习方法以及基本的递归神经网络方法,但其分类性能仍旧有待提高。
发明内容
发明目的:基于现有技术的不足,本发明提出一种利用高维表示提高特定属性情感分类准确率方法,首先利用本发明提出的子句切分算法将句子切分为若干子句,然后从单词、子句及句子三个不同的维度,利用评论文本及其特定属性信息构建多层次、高维度的深度神经网络模型,通过捕捉与特定属性更为相关的信息来提高分类性能。
技术方案如下:
一种利用高维表示提高特定属性情感分类准确率方法,包括训练阶段和测试阶段:
具体步骤为:
训练阶段:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于凯尔博特信息科技(昆山)有限公司,未经凯尔博特信息科技(昆山)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810754022.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:创建索引、数据查询方法、装置及计算机设备
- 下一篇:一种跨网闸数据同步方法