[发明专利]一种基于特征多样化的卷积神经网络的情感分析模型构建方法有效
申请号: | 201810421744.9 | 申请日: | 2018-05-04 |
公开(公告)号: | CN108763326B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 骆威奇;岳文静;陈志;金广华;魏梦冶;柴一帆 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 沈廉 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于特征多样化的卷积神经网络的情感分析模型构建方法。该方法首先导入情感词典集合与句子语料训练集,并对初始数据集做相应预处理,通过计算情感词在不同极性数据集上出现的文档频数来计算情感得分以及普通词条的权重得分,得到词条得分特征统计值并构建特征向量。把得到的情感词典情感得分向量以及普通词条权重得分向量与向量化后的训练集句子向量进行拼接或者运算操作,得到具有特征信息多样化的输入矩阵。最后用特定参数的卷积神经网络模型训练数据集,得到训练好的模型。本发明能够解决模型在模型训练过程中对更深层的隐藏情感信息挖掘不够全面的问题,还能够有效提高情感分类的精确度。 | ||
搜索关键词: | 一种 基于 特征 多样化 卷积 神经网络 情感 分析 模型 构建 方法 | ||
【主权项】:
1.一种基于特征多样化的卷积神经网络的情感分析模型构建方法,其特征在于,包括以下步骤:步骤1)输入情感单词数据集作为情感分析任务中的情感词集合,并在情感单词数据集中加入新兴社交网络词语,以此作为构建该模型所使用的情感词典,并输入带有标记的句子语料作为训练数据集;步骤2)分褒贬两类统计计算情感词典中的不同情感词在褒贬两类极性数据集上出现的次数并计算该情感词的情感得分;步骤3)使用相同维度的向量来表示情感词的情感得分和普通词条的权重得分,得到卷积神经网络需要的一次性接收文本的平行化输入,将每一个情感得分值用一个多维的连续值向量来表示,将每一个普通词条的权重得分映射为一个维度一样的多维连续值向量;步骤4)以词为单位将语料训练数据集中的不同句子表示为一个由词向量组成的二维矩阵,对于句子中的每一个词条,将词条映射为一个随数据集大小改变的m维的连续值向量;在卷积神经网络输入层,使用拼接和矩阵运算两种不同的矩阵计算方式验证本专利提出的多样化特征信息和卷积神经网络结合的有效性;步骤5)在数据集上训练一个卷积神经网络,卷积神经网络中使用多窗口、多卷积核对输入句子进行卷积操作,所述卷积神经网络包括卷积层,池化层,全连接层和一个softmax模型的输出层,线性整流函数即ReLU函数作为激活函数,并使用了dropout机制和权重的正则化限制训练模型,最小化交叉熵优化模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810421744.9/,转载请声明来源钻瓜专利网。