[发明专利]一种基于多通道模型的特定目标情感分析方法有效
申请号: | 201811291881.1 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109408823B | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 袁婷;黎海辉;薛云;胡晓晖 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35;G06Q30/02 |
代理公司: | 广州市科丰知识产权代理事务所(普通合伙) 44467 | 代理人: | 王海曼 |
地址: | 510000 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注意力机制 情感分析 预处理 情感分类 测试集 多通道 目标词 数据集 向量 自然语言处理技术 分类准确率 方法设置 分类结果 获取目标 欧式距离 评论文本 情感计算 特征提取 训练集 池化 分层 标签 测试 学习 | ||
本发明公开了一种基于多通道模型的特定目标情感分析方法,旨在提供一种特定目标情感分析方法,将目标词与上下文充分利用起来,本方法设置了三个通道,分别利用分层池化、交互注意力机制、基于欧式距离的注意力机制获取目标词和上下文的表示。通过三个通道,目标词和上下文可以学习到有助于情感分类的表示;其技术方案:(1)输入SemEval2014数据集,对数据集进行预处理并划分成训练集、测试集;(2)预处理后的数据分别输入到三个通道,进行特征提取以获得向量r1、r2、r3、r4和r5;(3)利用向量r1、r2、r3、r4和r5,通过注意力机制的学习,得到分类结果;(4)用训练好的模型对测试集中每个评论文本的特定目标进行情感分类,并与测试集本身的标签对比,以计算分类准确率;属于自然语言处理技术与情感计算领域。
技术领域
本发明属于自然语言处理技术与情感计算领域,具体地说是一种基于多通道深度学习模型的英文特定目标情感分析方法。
背景技术
随着电子商务行业的发展,网络购物越来越受到人们的认可,由此也产生了大量的网络评论文本数据。面对这些海量的网络评论,一方面消费者需要快速了解评论的情感倾向,从其他消费者的经验中得到对该物品的评价信息,优化自己的购买决策;另一方面商家也需要从消费者的网络评论情感倾向中总结得到商品的市场反馈信息,对商品进行改善。因此,如何对评论文本进行情感分类已经成为自然语言处理领域的一个重要研究课题。
传统的情感分类主要是为了得到句子的整体的情感倾向,当句子中含有多个目标词的时候,传统的情感分类的方法就忽略了具体每一个目标词的情感。因此对特定目标词的情感分析任务正逐渐被学术界所重视。对特定目标词的情感分类指的是当一个句子中含有多个目标词的时候,需要对不同的目标词进行情感倾向的判断。例如:The appetizersis ok,but the service is slow and the environment is bad.在这段评价中,通过分析知道,这段评论主要对三个方面进行了评价,分别是开胃菜,服务和环境。这三个目标词的情感倾向分别是积极,消极和消极。因此传统的情感分类面对这种多目标词的情况就显得不太适用。
情感分类方法主要经历了三个阶段,第一阶段是基于词典和语言学规则的情感分类方法,这种分类方法本质上依赖于情感词典和判断规则的质量,需要人工设计,因此这类方法的优劣很大程度上都取决于人工设计和先验知识。在网络迅速发展的今天,出现了很多新词语,如:给力、坑爹,这使得词典需要实时的更新,即便如此也很难跟上时代的发展,因此基于词典的方法变得不再实用。第二阶段是基于机器学习的情感分类方法,其核心是特征提取和分类器设计,常用的特征工程包括:句法特征,(term frequency–inversedocument frequency,TF-IDF)特征等;常见的分类器有决策树、贝叶斯分类器、支持向量机等。然而这些传统的情感分析方法都高度依赖于所获得的特征质量,并且特征工程的工作量也十分巨大,所以显得不太适用。因此基于深度学习的方法应运而生,深度学习的方法首先通过海量的样本学习到词的表示即词向量,之后将词向量作为神经网络的输入,经过多层网络提取出特征,最后通过全连接得到分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811291881.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种跨语言图书相关度分析方法及系统
- 下一篇:用于生成信息的方法和装置