[发明专利]一种文本情感分类方法及装置在审
申请号: | 201910375929.5 | 申请日: | 2019-05-07 |
公开(公告)号: | CN110059191A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 刘方爱;张敬仁;徐卫志;王倩倩;孙文晨;谭俏俏;赵俊杰 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F17/27;G06N3/04 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 杨哲 |
地址: | 250358 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 文本情感分类 特征矩阵 池化 构建 朴素贝叶斯分类器 全局特征向量 滑动窗口 卷积运算 模型参数 文本数据 下降算法 词向量 串接 降维 卷积 拼接 并行 优化 改进 | ||
本公开公开了一种文本情感分类方法及装置,该方法包括:接收文本数据,构建分布式词向量,得到特征矩阵;将特征矩阵输入卷积神经网络模型,通过所述卷积神经网络模型的多滑动窗口的卷积层对特征矩阵进行卷积运算;通过所述卷积神经网络模型的k‑max和avg‑pooling并行双池化层进行池化操作;通过所述卷积神经网络模型的串接层拼接构建文本级别的全局特征向量,对其降维后运用朴素贝叶斯分类器获取文本情感分类结果;采用改进的梯度下降算法优化所述卷积神经网络模型参数。
技术领域
本公开属于自然语言处理和深度学习的技术领域,涉及一种文本情感分类方法及装置。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
伴随着计算机通信水平的显著提升,互联网用户的角色也由原本的信息接受者悄然转变为信息的创造者。与此同时,社交媒体也步入了发展的快车道,促使用户形成了以短文本为主的表达方式。因此,短文本的情感分析具有了更加重要的应用意义。文本情感分析是以情感词典,数据挖掘,机器学习等技术为支撑,透过文本的实际内容,处理并获取作者对文本内容的基本态度,情绪和观点。从而更好的反作用于生产应用与社会实践。网络短文本包含了丰富的用户情信息,具有丰富的研究意义。
基于传统的短文本情感分析主要包括两大类:基于情感词典的方法和基于机器学习的方法。基于情感词典的方法主要是通过情感词来确定情感极性,但是情感词典需要人工构建,这种方法利用情感词的情感色彩判断句子整体的情感倾向,没有考虑到上下文关系,是一种相对底层的情感分类方法。后者主要是利用有监督的机器学习的方法,用训练好的分类器对文本进行情感分类,虽然其在情感极性的判断上与传统的情感词典方法相比有了明显的提高,考虑到了上下文语义信息,但是也存在着受限于稀疏的特征表达,每一个特征都用一个高维的稀疏向量进行表示,难以判别语义相似的特征,常常依赖于人工抽取特征等问题。
近几年以来,随着深度学习技术的高质量发展,其在大规模文本数据的智能理解上表现出了独特的优势,现存的诸如LSTM,RNN,CNN 等神经网络模型已经大量的应用在了文本情感分析并且取得了不错的实验结果,其中,Kim等在多个情感分类数据集上将多种深度学习模型进行了对比,结果发现卷积神经网络在文本情感分析,特别是短文本情感分析中,具有更好的实验效果。然而,发明人在研发过程中发现,卷积神经网络在情感多分类方面还存在着准确度不高,提取上下文语义薄弱等问题。虽然近几年对于卷积神经网络的改进层出不穷,但是仍然无法较好的解决网络短文本创作随意性和语义深层次性问题。
发明内容
针对现有技术中存在的不足,本公开的一个或多个实施例提供了一种文本情感分类方法及装置,结合改进梯度下降算法(PSGD)并对卷积神经网络结构进行改进后实现文本情感分类,有效弥补现存卷积神经网络文本分类方法存在着准确度不高,提取上下文语义薄弱、无法有效解决池化层降维损失语义信息、和参数更新算法不稳定等问题。
根据本公开的一个或多个实施例的一个方面,提供一种文本情感分类方法。
一种文本情感分类方法,该方法包括:
接收文本数据,构建分布式词向量,得到特征矩阵;
将特征矩阵输入卷积神经网络模型,通过所述卷积神经网络模型的多滑动窗口的卷积层对特征矩阵进行卷积运算;
通过所述卷积神经网络模型的k-max和avg-pooling并行双池化层进行池化操作;
通过所述卷积神经网络模型的串接层拼接构建文本级别的全局特征向量,对其降维后运用朴素贝叶斯分类器获取文本情感分类结果;
采用改进的梯度下降算法优化所述卷积神经网络模型参数。
进一步地,在该方法中,对接收的文本数据进行数据预处理,将数据预处理后的文本数据通过word2vec工具构建分布式词向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910375929.5/2.html,转载请声明来源钻瓜专利网。