[发明专利]一种文本情感分类方法及装置在审
申请号: | 201910375929.5 | 申请日: | 2019-05-07 |
公开(公告)号: | CN110059191A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 刘方爱;张敬仁;徐卫志;王倩倩;孙文晨;谭俏俏;赵俊杰 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F17/27;G06N3/04 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 杨哲 |
地址: | 250358 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 文本情感分类 特征矩阵 池化 构建 朴素贝叶斯分类器 全局特征向量 滑动窗口 卷积运算 模型参数 文本数据 下降算法 词向量 串接 降维 卷积 拼接 并行 优化 改进 | ||
1.一种文本情感分类方法,其特征在于,该方法包括:
接收文本数据,构建分布式词向量,得到特征矩阵;
将特征矩阵输入卷积神经网络模型,通过所述卷积神经网络模型的多滑动窗口的卷积层对特征矩阵进行卷积运算;
通过所述卷积神经网络模型的k-max和avg-pooling并行双池化层进行池化操作;
通过所述卷积神经网络模型的串接层拼接构建文本级别的全局特征向量,对其降维后运用朴素贝叶斯分类器获取文本情感分类结果;
采用改进的梯度下降算法优化所述卷积神经网络模型参数。
2.如权利要求1所述的一种文本情感分类方法,其特征在于,在该方法中,对接收的文本数据进行数据预处理,将数据预处理后的文本数据通过word2vec工具构建分布式词向量;
所述数据预处理包括数据清洗和分词。
3.如权利要求1所述的一种文本情感分类方法,其特征在于,在该方法中,所述卷积层包括多个窗口大小不同的卷积核,通过所述卷积神经网络模型的多个窗口大小不同的卷积核对所述特征矩阵进行卷积运算,提取不同窗口大小的文本局部语义向量;
每个所述卷积层包括若干个并行运算的卷积单元。
4.如权利要求3所述的一种文本情感分类方法,其特征在于,在该方法中,所述卷积神经网络模型还包括滤波单元,经过所述卷积层卷积运算得到的文本局部语义向量通过所述滤波单元,完成特征抽取。
5.如权利要求1所述的一种文本情感分类方法,其特征在于,在该方法中,所述k-max和avg-pooling并行双池化层包括并行的avg-pooling池化层和k-max池化层;所述k-max池化层根据卷积核高度确定特征图下采样个数,所述卷积核高度与特征图下采样个数成反比。
6.如权利要求1所述的一种文本情感分类方法,其特征在于,在该方法中,采用PCA对全局特征向量进行降维。
7.如权利要求1所述的一种文本情感分类方法,其特征在于,在该方法中,所述采用改进的梯度下降算法优化所述卷积神经网络模型参数为通过选取数据相关性较高的样本来形成卷积神经网络模型的批量数据训练集。
8.一种计算机可读存储介质,其中存储有多条指令,其特征在于,所述指令适于由终端设备的处理器加载并执行如权利要求1-7任一项所述的一种文本情感分类方法。
9.一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令适于由处理器加载并执行如权利要求1-7任一项所述的一种文本情感分类方法。
10.一种文本情感分类装置,其特征在于,基于如权利要求1-7任一项所述的一种文本情感分类方法,包括:
数据采集模块,被配置为接收文本数据,构建分布式词向量,得到特征矩阵;
卷积神经网络模块,被配置为将特征矩阵输入卷积神经网络模型,通过所述卷积神经网络模型的多滑动窗口的卷积层对特征矩阵进行卷积运算;通过所述卷积神经网络模型的k-max和avg-pooling并行双池化层进行池化操作;通过所述卷积神经网络模型的串接层拼接构建文本级别的全局特征向量,对其降维后运用朴素贝叶斯分类器获取文本情感分类结果;
参数优化模块,被配置采用改进的梯度下降算法优化所述卷积神经网络模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910375929.5/1.html,转载请声明来源钻瓜专利网。