[发明专利]基于深度学习的主观性文本情感分析方法有效
申请号: | 201710093687.1 | 申请日: | 2017-02-21 |
公开(公告)号: | CN106776581B | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 施寒潇;厉小军;陈南南 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/35 |
代理公司: | 33224 杭州天勤知识产权代理有限公司 | 代理人: | 胡红娟 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的主观性文本情感分析方法,包括:(1)在C&W模型的基础上,构建C&W‑SP模型,将句子的情感标签与词性标签标注于句子内,构建C&W_SPC&W‑SP模型的训练集,并利用该训练集对C&W_SP模型进行训练,得到训练集中每个词的词向量,组成词向量文件;(2)根据获得的词向量文件,利用LSTM模型构建句子向量集;(3)利用句子向量集对神经网络模型进行训练,得到情感分类模型;(4)对测试评论语句进行预处理,测试句子向量将测试句子向量输入到情感分类模型中,计算得到此段评论的情感倾向。该方法情感倾向信息、词性信息加入词语中,提高了情感分析的准确度。 | ||
搜索关键词: | 基于 深度 学习 主观性 文本 情感 分析 方法 | ||
【主权项】:
1.一种基于深度学习的主观性文本情感分析方法,包括以下步骤:/n(1)在C&W模型的基础上,构建C&W-SP模型,将句子的情感标签与词性标签标注于句子内,构建C&W-SP模型的训练集,并利用该训练集对C&W-SP模型进行训练,得到训练集中每个词的词向量,组成词向量文件,具体包括:/n(1-1)添加获取句子的情感信息的情感抽取模块和获取句子中每个词的词性信息的词性标注模块于C&W模型上,得到C&W-SP模型;/n(1-2)对数据集以句子为单位进行中文分词操作,得到由m个句子组成的分词数据集;/n(1-3)将分词数据集中的每个句子的情感标签和每个句子中的每个词语的词性标签标注于该句子内,作为C&W-SP模型训练集;/n(1-4)将C&W-SP模型训练集输入到C&W-SP模型中,以C&W-SP模型损失函数最小化为目标,采用随机梯度下降和反向传播算法更新模型参数,得到该训练集中每个词对应的词向量,组成词向量文件;/n(2)根据获得的词向量文件,利用LSTM网络构建句子向量集;/n(3)利用句子向量集对神经网络模型进行训练,得到情感分类模型;/n(4)对测试评论语句进行分词处理、情感标签与词性标签标注处理,并根据步骤(1)获得的词向量文件获得该测试评论的词向量输入矩阵;然后通过步骤(2)的方法将测试词向量转化为测试句子向量,将测试句子向量输入到情感分类模型中,计算得到此段评论的情感倾向。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710093687.1/,转载请声明来源钻瓜专利网。