[发明专利]一种融合外部知识与交互注意力机制的视角级文本情感分类方法及系统有效
申请号: | 202011184688.5 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112199504B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 廖祥文;曾梦美;邓立明;陈甘霖;陈开志 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/247;G06F40/30;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 钱莉;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 外部 知识 交互 注意力 机制 视角 文本 情感 分类 方法 系统 | ||
本发明涉及一种融合外部知识与交互注意力机制的视角级文本情感分类方法及系统,包括步骤:构建带有外部知识的文本序列内容,同时引入哨兵向量改善外部知识对模型的误导作用;构建带有交互信息及位置信息的记忆内容;构建记忆内容的多层注意力表示,并将注意力结果与门控循环单元非线性结合,最终形成视角级文本情感特征表示;采用分类函数得到文本最终的情感分类结果。本发明能够对视角级文本进行特征化处理,并通过BiLSTM从文本中提取语义特征,然后通过多层注意力机制,得到最终的分类结果。
技术领域
本发明涉及文本处理技术领域,特别是一种融合外部知识与交互注意力机制的视角级文本情感分类方法及系统。
背景技术
视角级文本情感分析旨在研究评论文本关于给定视角词的情感极性(如积极、消极和中性)。作为情感分析中的一项细粒度任务,视角级文本情感分析能够提供比文档级或句子级的情感分析更全面、更深入的分析,其可广泛应用于产品定价、竞争情报、股市预测等领域,具有重要的理论研究意义和实际应用价值。如图1,文本中有两个视角词“salmon”和“waiter”,该文本关于视角词“salmon”的情感极性是积极的,而关于视角词“waiter”的情感极性是消极的。视角级文本情感分析可以准确把握用户对产品的各个方面的情感态度,而以句子为导向的文本情感分析却无法捕捉到针对视角词的中细粒度情感。因此视角级文本情感分析逐渐受到了广泛关注,成为研究热点之一。
近年来,国内外已有很多针对视角级文本情感分析任务开展的相关研究,并且取得了一定的研究成果。现有的相关研究方法主要可以分为两类:基于传统机器学习的方法和基于神经网络的学习方法。
基于传统机器学习的视角级文本情感分析方法通过输入大量的标注语料以及这些标注语料的情感标签,训练和这些语料相关的评论数据的情感分类器,如支持向量机(Support Vector Machine,SVM)、最大熵(Maximum Entropy Model,MaxEnt)、KNN(K-Nearest Neighbor algorithm,K最邻近方法)等,然后通过这些训练好的分类器来预测新的文本数据的情感。这类方法虽然在视角级文本情感分析领域取得一定成效,但是需要大量的特征工程,耗时耗力,性能很大程度上受限于人工特征的质量,且模型复杂、泛化能力较差。
随着深度学习的快速发展,基于多层神经网络的表示学习模型在语义表示与情感分析运用方面更具优势。许多研究者们也将这些模型用于视角级文本情感分析。一些研究人员提出将深度学习与传统的方法相结合处理视角级文本情感分类问题,如将循环神经网络(RNN)和句法分析树相结合等,这些方法相比传统的方法取得了比较好的性能,但是还是依赖了情感词典、句法分析等传统手段,性能还有待提升。为了摆脱传统的方法,有研究人员引入一个深度记忆网络来进行视角级文本情感分类,通过双向长短时记忆网络并结合位置信息来构造记忆块,然后计算多重注意力的结果,最后利用门限控制单元进行非线性的结合来得到文本的情感特征表示。该类方法虽然能够更好地处理复杂的句子,但是对文本中单词在不同语境下可能有不同含义欠缺考虑。因此人们希望能够找到一种更加高效的视角级文本情感分类方法,进而提高视角级文本情感分类的性能和降低资源的消耗。
发明内容
有鉴于此,本发明的目的是提出一种融合外部知识与交互注意力机制的视角级文本情感分类方法及系统,能够对视角级文本进行特征化处理,并通过BiLSTM从文本中提取语义特征,然后通过多层注意力机制,得到最终的分类结果。
本发明采用以下方案实现:一种融合外部知识与交互注意力机制的视角级文本情感分类方法,具体包括以下步骤:
构建带有外部知识的文本序列内容,同时引入哨兵向量改善外部知识对模型的误导作用;
构建带有交互信息及位置信息的记忆内容;
构建记忆内容的多层注意力表示,并将注意力结果与门控循环单元非线性结合,最终形成视角级文本情感特征表示;
采用分类函数得到文本最终的情感分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011184688.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种降噪装置
- 下一篇:一种微孔物证痕迹取证仪