[发明专利]一种基于深度学习的文本情感分析方法有效
申请号: | 201911189487.1 | 申请日: | 2019-11-28 |
公开(公告)号: | CN110889282B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 张健沛;黄乐乐;杨静;王勇 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/211;G06F40/216;G06N3/0464 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 文本 情感 分析 方法 | ||
本发明提供了一种基于深度学习的文本情感分析方法。(1)输入文本数据,去除停用词,提取关键字,形成关键字集合。(2)通过构建关键字共现图,形成稠密的子图;获取子图和文档中句子的向量表示,进而将句子分配给子图;设计子图与子图之间的边缘连接和边缘权重,形成文档的拓扑交互图表达;(3)将拓扑交互图作为Emo‑GCN模型的输入,进行抽取节点特征变换,然后融合局部结构信息,获得节点聚合矩阵。将聚合的信息做非线性变换。Emo‑GCN模型采用层级结构,逐层抽取特征。本发明采用新颖的拓扑交互图表达文本信息进而使用图卷积神经网络进行文本情感分析,并且仍然具备强大的适应性。该方法应用于产品推荐、市场预测、决策调整。
技术领域
本发明涉及的是一种自然语言处理方法,也涉及一种图像分类方法,具体地说是一种文本情感分析方法。
背景技术
文本分类是自然语言处理领域的经典问题,而情感识别是文本分类中比较有挑战性的工作,当前处理情感分析问题的方法主要有以下三种:一是构造情感词典来进行情感分析,将情感词汇构建成情感词典对于情感分析来说是一个必要而不充分条件,情感词典内容无论如何拓展都无法包含全部情感表达形式,另外有些词汇情感极性并不明确,有些语句可能没有用到情感词汇,但是也表达了某种情感,再有就是在一些语境下有些情感词汇表达了恰恰相反的意思,这些问题就会导致该方法的局限性;二是传统的机器学习方法如逻辑回归(Logistic Regression)、朴素贝叶斯(Naive Bayes)等,其中逻辑回归只能用于线性二分类问题,朴素贝叶斯的结论基于特征的先验概率,而特征之间假设完全独立,这些要求在现实情况中往往是不满足的,分类效果有时差强人意,因此也有很大的局限性;三是目前比较热门的深度学习方法如卷积神经网络(Convolutional Neural Network,CNN),循环神经网络(Recurrent Neural Network,RNN)等,它们采用的都是基于欧式空间的数据,最大特点就是具有规则的空间结构,特征可以用一维或者二维矩阵来表示,处理起来比较高效。但是在现实生活中,大部分数据都是不规则的结构,这种数据会用拓扑交互图来表达,不具备平移不变性,很难选去一个固定的卷积核来适应整个图的不规则性,这种结构的数据就会令CNN或RNN瞬间失效。
由于文本情感的本质具有复杂性,一段文本并不是词语的简单线性组合,我们在描述一个句子时,都是将句子作为一个整体而不是词语的集合来看待的,词语的不同组合、不同顺序、不同数量都会表达不同的含义和情感,这导致了文本情感分析工作的困难,因此,文本情感分析工作实际上是对人脑思维的模拟。真正的情感判断并不是简单的规则罗列,而是一个复杂的网络。因此,采用文本情感分析的图神经网络算法(Emotion GraphConvolutional Network,Emo-GCN),将文本信息抽象成一张拓扑交互图表达,Emo-GCN可以在图中提取特征,从而对图中的节点进行分类,进而对图数据进行分类。图数据在空间上具有以下两个特征:一是节点特征,每个节点都具有自己的特征,该特征体现在点上;二是结构特征,节点与节点之间存在一定的联系,该特征体现在边上。总的来说,图数据既要考虑节点信息,也要考虑结构信息,图卷积神经网络就可以既学习节点特征,又能学习节点与节点之间的关联信息,最终达到情感分析的目的。
发明内容
本发明的目的在于提供一种具有较好精确度的基于深度学习的文本情感分析方法。
本发明的目的是这样实现的:
(1)文本数据预处理:去除停用词,提取关键字,所述的提取关键字是采用TextRank关键字提取算法形成关键字集合;
(2)构建文档拓扑交互图:通过构建关键字共现图,形成稠密的子图;获取子图和文档中句子的向量表示,进而将句子分配给子图;设计子图与子图之间的边缘连接和边缘权重,形成文档的拓扑交互图表达;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911189487.1/2.html,转载请声明来源钻瓜专利网。