[发明专利]一种用户评论文本情感分析方法及装置在审
申请号: | 202010529486.3 | 申请日: | 2020-06-11 |
公开(公告)号: | CN111708864A | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 徐志刚;董铠;朱红蕾 | 申请(专利权)人: | 兰州理工大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06K9/62;G06N3/04;G06F16/35 |
代理公司: | 北京文苑专利代理有限公司 11516 | 代理人: | 于利晓 |
地址: | 730050 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 评论 文本 情感 分析 方法 装置 | ||
本发明提供了一种用户评论文本情感分析方法及装置,该方法包括:获取用户评论文本;将所述用户评论文本转换为多个原始词向量;计算所述多个原始词向量中词向量的注意力权重;根据所述多个原始词向量、注意力权重,生成新词向量;确定所述注意力权重大于阈值的新词向量为关键词;使用C‑GRU神经网络,根据所述关键词,对所述用户评论文本进行情感分类。本申请使用注意力机制对每个词向量进行扩展,使得文本中的关键信息更容易被获取;C‑GRU网络模型能够用CNN获取到评论的局部特征信息,再用GRU学习到文本的上下文信息和层次结构信息,解决评论不规范、稀疏、主旨不明确的特点,实现了用户评论文本的有效分析。
技术领域
本发明涉及信息处理领域,具体而言,涉及一种用户评论文本情感分析方法及装置。
背景技术
近年来,我国互联网技术迅速发展,越来越多的用户在网上购物的同时,喜欢对商品进行评论,所以购物网站上存在着大量的短文本评论。通过对用户评论情感分析可以帮助消费者判断商品质量,同时帮助企业掌握产品的不足以及市场的需求,从而提高产品的竞争力。现有技术无法对用户评论文本实现有效分析。
发明内容
为了解决目前无法对用户评论文本实现有效分析的问题,本申请实施例提供了一种用户评论文本情感分析方法及装置,实现了用户评论文本的有效分析。
第一方面,本申请实施例提供了一种用户评论文本情感分析方法,包括:
获取用户评论文本;
将所述用户评论文本转换为多个原始词向量;
计算所述多个原始词向量中词向量的注意力权重;
根据所述多个原始词向量、注意力权重,生成新词向量;
确定所述注意力权重大于阈值的新词向量为关键词;
使用C-GRU神经网络,根据所述关键词,对所述用户评论文本进行情感分类。
其中,所述计算所述多个原始词向量中词向量的注意力权重,包括:
通过以下计算式计算注意力权重αi,j:
其中,hi为第i个原始词向量,hj为第j个原始词向量,score(hi,hj)为计算两个词向量的相关系数的函数,
其中,λ为距离衰减因子,u=|j-i|-1,νa和Wa为训练参数,T表示向量的转置,·表示两个多项式的乘积,为两个词向量的卷积。
其中,还包括:
预处理用户评论文本,所述预处理包括去除不需要和有缺失的数据、分词,去除标点。
其中,所述将所述用户评论文本转换为多个原始词向量,包括:
采用Word2vec模型中的Skip-Gram模型将用户评论文本转化为K维向量实数值。
其中,所述使用C-GRU神经网络,根据所述关键词,对所述用户评论文本进行情感分类,包括:
所述C-GRU神经网络主要关注所述关键词,对所述用户评论文本进行情感分类。
第二方面,本申请实施例提供了一种用户评论文本情感分析模型,包括:
输入层,用于采用Word2vec模型中的Skip-Gram模型将预处理后的用户评论文本转化为K维向量实数值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州理工大学,未经兰州理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010529486.3/2.html,转载请声明来源钻瓜专利网。