[发明专利]基于和积网络深度自动编码器的短文本情感分析方法有效
申请号: | 201710573654.7 | 申请日: | 2017-07-14 |
公开(公告)号: | CN107357899B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 王生生;张航;赖永 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 长春市恒誉专利代理事务所(普通合伙) 22212 | 代理人: | 李荣武 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于和积网络深度自动编码器的短文本情感分析方法,该方法包括以下步骤:一、预处理短文本数据;二、利用doc2vec模型训练句向量;三、利用和积网络深度编码器对句向量进行编码,得到句向量的分层抽象特征;四、利用最大积网络深度解码器对分层抽象特征解码,将解码后的特征与原始句向量特征对比,计算重构误差。调整和积网络深度自动编码器参数使得重构误差最小。得到最优的和积网络深度编码器,由它获得最优分层抽象特征;五、利用最优分层抽象特征进行在线结构学习生成一个和积网络结构,使用少量带标签的短文本数据微调和积网络,使用在线参数学习算法不断调整网络参数,输入测试集,由训练好的和积网络获得情感分类类别。 | ||
搜索关键词: | 基于 网络 深度 自动 编码器 文本 情感 分析 方法 | ||
【主权项】:
一种基于和积网络深度自动编码器的短文本情感分析方法其特征在于:至少包括以下步骤:步骤一、预处理在线爬取的短文本数据;采用Porter算法、正则表达式方法等对在线爬取的无标签短文本数据进行预处理;步骤二、利用doc2vec模型训练句向量;采用doc2vec模型对步骤一获得的短文本数据进行训练得到句向量;步骤三、提出使用和积网络在线结构学习算法对步骤二得到的句向量进行在线结构学习,得到一个和积网络深度编码器;使用所得到的和积网络深度编码器对步骤二获得的句向量进行编码,得到句向量的分层抽象特征;步骤四、构建最大积网络深度解码器,对步骤三得到的分层抽象特征进行解码;将解码后的特征与步骤二输入和积网络深度编码器的句向量特征对比,计算重构误差;调整和积网络深度自动编码器参数使得重构误差最小;最终,得到最优的和积网络深度编码器,并由它获得最优分层抽象特征;步骤五、利用由步骤四得到的最优分层抽象特征进行在线结构学习生成一个和积网络模型,使用少量带标签的短文本数据微调和积网络模型,和积网络模型使用其在线参数学习算法不断调整优化网络参数;输入测试集,由训练好的和积网络模型获得情感分类类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710573654.7/,转载请声明来源钻瓜专利网。