[发明专利]一种基于注意力机制和双向LSTM方面情感分析系统在审
申请号: | 202011208084.X | 申请日: | 2020-11-03 |
公开(公告)号: | CN112347251A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 李书豪 | 申请(专利权)人: | 青岛理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/215;G06F16/951;G06F16/903;G06F16/955;G06N3/04;G06N3/08 |
代理公司: | 北京化育知识产权代理有限公司 11833 | 代理人: | 尹均利 |
地址: | 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 双向 lstm 方面 情感 分析 系统 | ||
1.一种基于注意力机制和双向LSTM方面情感分析系统,其特征在于:主要由数据获取模块、数据清洗模块、模型训练模块和统计分析模块组成,所述数据获取模块与所述数据清洗模块电连接,所述数据清洗模块与所述模型训练模块电连接,所述模型训练模块与所述统计分析模块电连接,所述数据获取模块主要由评论数据爬取和评论数据存储组成,所述数据清洗主要由拼写检查、去除杂质、去除停用词和过滤无效数据组成,所述模型训练模块主要由方面识别模型训练和情感分析模型训练组成,所述统计分析模块主要由方面数据和方面情感数据组成。
2.根据权利要求1所述的一种基于注意力机制和双向LSTM方面情感分析系统,其特征在于:所述评论数据爬取对网页源码进行爬取、文本解析,并将数据存储至所述评论数据存储中。
3.根据权利要求2所述的一种基于注意力机制和双向LSTM方面情感分析系统,其特征在于:所述数据清洗模块对所述评论数据存储中的数据进行预处理,去除数据中的杂质。
4.根据权利要求3所述的一种基于注意力机制和双向LSTM方面情感分析系统,其特征在于:所述数据清洗模块清洗后的数据作为词向量训练模型的输入,所述词向量训练模型的输出作为所述方面识别模型与所述方面情感分析模型的输入,所述方面识别模型的结果以管道的方式传输给所述方情感分析模型,所述情感分析模型的结果传输给前端。
5.根据权利要求4所述的一种基于注意力机制和双向LSTM方面情感分析系统,其特征在于:所述模型训练模块中的所述情感分析模型的结果进行统计分析,以可视化的形式显示在所述前端页面上。
6.根据权利要求2所述的一种基于注意力机制和双向LSTM方面情感分析系统,其特征在于:所述评论数据爬取主要由获取爬取目标、数据采集和数据分析组成。
7.根据权利要求6所述的一种基于注意力机制和双向LSTM方面情感分析系统,其特征在于:所述获取爬取目标:输入要爬取网站的URL,将这些输入的所述URL加入爬取队列,所述数据采集:利用python的scrapy爬虫框架爬取队列中的网站源码,所述数据解析:利用所述python的re库构建正则表达式对采集到的URL源码进行文本解析获取用户评论数据。
8.根据权利要求1所述的一种基于注意力机制和双向LSTM方面情感分析系统,其特征在于:所述方面识别模型训练的公式为
P=σ(Wrr+br);
所述方面识别模型训练优化参数使用的损失函数的公式为
9.根据权利要求8所述的一种基于注意力机制和双向LSTM方面情感分析系统,其特征在于:所述情感分析模型训练的计算公式为
α=softmax(WTM)和r=HαT;
最终输出的文本公式为
h*=Tanh(Wpr+Wqhn);
所述情感分析模型训练的输出阶段添加softmax层将文本表示转化为情感极性的条件概率分布,所述softmax层的公式如公式
y=softmax(Wsh*+b);
所述情感分析模型训练损失函数公式为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛理工大学,未经青岛理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011208084.X/1.html,转载请声明来源钻瓜专利网。