[发明专利]一种基于图神经网络的特定目标情感分类方法有效
申请号: | 202010379339.2 | 申请日: | 2020-05-07 |
公开(公告)号: | CN111563164B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 高正杰;冯翱;宋馨宇 | 申请(专利权)人: | 成都信息工程大学;成都点石瑞达科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 成都智涌知识产权代理事务所(普通合伙) 51313 | 代理人: | 周正辉 |
地址: | 610200 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 特定 目标 情感 分类 方法 | ||
本发明涉及一种基于图神经网络的特定目标情感分类任务,包括采集数据集并初始化BERT模型,通过BERT模型得到每个目标词的一维特征向量,将目标词的特征向量输入到图卷积神经网络模型中,构造网络拓扑图,并计算邻接矩阵,根据邻接矩阵通过三种方式来获取网络拓扑图中节点的三种特征,引入关系分类任务,整个模型在分类上分为两个阶段两个任务,两个任务分别是目标主体的情感极性分类和目标主体之间的关系分类。本发明采用图神经网络,对句子中出现的多个主体进行构图,同时对多个目标进行处理,更符合人类判断情感极性的认知规律,有助于保证模型的效果,与此同时引入关系分类任务进行辅助分类,更进一步提升了分类的准确率。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种基于图神经网络的特定目标情感分类方法。
背景技术
随着各种互联网新媒体形式的涌现和电子商务平台的发展,日益增长的用户群体在广泛参与网络活动的同时产生了海量的用户生成内容。在这一背景下,针对互联网上的海量主观性文本进行准确的情感分析和观点挖掘就变得尤为重要,其中细粒度的情感分析在近几年得以迅速发展。细粒度情感分析旨在挖掘一条评论中用户对不同目标主体的不同情感倾向,在实际应用场景中,诸如精细的产品模型、用户画像和个性化推荐等领域存在极大的应用前景。
确定文本情感倾向的任务称为情感分类任务,在情感分类任务中又可分为粗粒度和细粒度两大领域,关于粗细粒度任务的划分有两个标准,一是根据分类的类别进行划分,一般将正面、负面和中性这样的三分类任务称之为粗粒度,与之相对应的愤怒、厌恶、恐惧、高兴、喜爱、悲伤和惊讶这样更加精细的分类任务则是细粒度情感分类任务;二是根据评价对象进行划分,如果判别的情感主体是一个文档或一个句子,则是粗粒度,如果是围绕文档或句子中某个特定主体进行情感倾向的分析则是细粒度。
判断给定句子中某个特定主体或目标词的情感倾向。对于该任务的解决思路有两种:一种是将句子中的每一个实体单独进行处理,重复多次;另一种思路是对个实体或目标词同时进行处理。处理方法上有三种,分别是基于情感词典、规则和机器学习的方法,基于传统词嵌入的深度学习方法以及基于BERT预训练模型的深度学习方法。
基于情感词典的方法主要是通过构建情感词典以及一系列的规则来判断文本的情感极性,依靠一些已有的情感词典和领域词典以及一系列的规则构建情感分类器,但情感词典的维护需要耗费大量的人力物力,并且随着新词的不断涌现,己经不能满足应用需求,亟待改进与优化。或者由领域专家从文本中筛选出一组具有统计意义的特征,然后利用机器学习的方法构建分类模型判别文本的情感极性,常见的分类模型有朴素贝叶斯、最大熵和支持向量机等,但存在的不足是:对不同的数据集,需要专家选取不同的特征,投入的成本较大,不同的特征选择方法会使得最终的分类结果差异较大,在不同的数据集上也可能存在差异很大的表现,模型的泛化能力较差。另外,传统方法多采用词袋模型,无法表示词语间的关系以及目标词所处句子中的上下文信息。
基于深度学习的方法是目前使用最广泛的方法,深度学习模型可以从输入的文本词向量表达中自动提取特征,通过多层神经网络,将高维抽象的语义特征组合成低维稠密的语义特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学;成都点石瑞达科技有限公司,未经成都信息工程大学;成都点石瑞达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010379339.2/2.html,转载请声明来源钻瓜专利网。