[发明专利]基于多任务联合学习的文本情绪原因识别系统有效
申请号: | 202011138387.9 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112183064B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 廖祥文;李泽南;陈志豪;张艳茹;叶锴 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06F40/284;G06F40/30;G06F40/126;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 联合 学习 文本 情绪 原因 识别 系统 | ||
本发明涉及一种基于多任务联合学习的文本情绪原因识别系统。包括:数据预处理模块,用于对数据进行预处理;文本编码模块,提取文本内容上下文依赖关系,获取其隐层向量表示,作为文本子句信息的整体表示;相对位置信息嵌入模块,从相对位置表示中学习出相对位置信息,并将其嵌入到文本子句向量中。情绪分类子任务模块,通过引入情绪分类子任务,使模型学习到的相对位置信息表示能帮助情绪识别任务精准的定位目标子句的位置;情绪原因识别标签输出模块,用于分析文本子句之间的上下文关系,完成情绪原因识别的标签预测工作。本发明能够从文本数据中学习高质量的文本向量特点,最终标注出关键情绪词的原因。
技术领域
本发明涉及情感分析和情绪挖掘领域,更具体地,涉及一种基于多任务联合学习的文本情绪原因识别系统,,能够较好地提取文本的语音信息,能有效利用文本子句的相对位置信息,能够精确的识别标注出文本中的情绪原因。
背景技术
个体情绪原因分析是自然语言处理领域非常重要的研究方向之一,它主要研究个体文本数据所蕴含的情绪及与情绪相关的深层信息,近年来由于其广泛的应用潜力而受到关注,研究者们主要利用自然语言处理技术对个体文本数据进行分析,挖掘其中所包含的情绪的过程,是舆情分析监控及商品质量反馈等应用的核心部分。然而,仅对个体情绪进行分析是不够充分的,知其然也需要知其所以然,产生情绪及情绪发生变化的原因比情绪本身有时候更值得引起我们重视。比如,决策者可能更关心反对者反对的原因,而不仅仅是反对者的数量。
Chen和Lee等人首次提出个体情绪原因提取任务,他们从中科院研究所中平衡语料库中手动构建了一个关于个体情绪原因提取的小型语料库,并且基于该语料库开发了一种基于规则的方法来检测情绪原因。Gao等人提出一种基于规则的情绪原因识别模型,然后对相应的微博数据进行情绪原因的抽取,然而,制定的规则并不能完全覆盖所有的语言现象,而且同一个子句可能同时匹配多个规则,很容易造成规则冲突。再者不同领域语料的语言结构有一定的区别,针对特定领域的文本制定的规则并不能很好地适用于其他领域的文本,需要耗费巨大的人力物力重新分析语言结构来添加新的规则。Alena Neviarouskaya通过句法、语法和规则相结合的方法,分析情绪原因的语言现象,以此来推测一段文本的情绪类别和情绪原因。Weiyuan Li等人通过抽取情绪原因特征进行情绪分类,其特征抽取仍采用基于规则的方法。
在基于统计方法的情绪原因识别方面,袁丽提取语言学线索词的特征、句子距离特征、候选词词法特征等信息,然后得到特征向量空间,最后应用SVM分类器和条件随机场对个体情绪归因进行了判别。Lin Gui等人不仅通过建立25条规则来进行个体情绪原因的预测,还运用分类方法来预测个体情绪原因。李逸薇等将个体情绪归因识别任务看成序列标注,并建立了相应的模型,将所有候选原因子句当成一个序列,从而标记出哪些属于原因子句,她特别指出在利用序列标注模型进行情绪原因识别的过程中,上下文特征尤为重要。Ghazi D等人利用FrameNet建立了情绪和情绪原因相关联的数据集,然后利用CRF来预测文本句子级别的情绪。Gaoyan Ou等人建立文本公众情绪和情绪事件之间关系,利用文本情绪对文本中事件进行预测。Lin Gui等人首先构建了一个情绪归因语料库,标注了表达情绪的核心子句,在核心句的前后子句中标注情绪原因子句,然后从核心句的前后每个子句中抽取候选原因事件,通过训练分类器,最后判定抽取的候选原因事件是否是情绪核心子句的原因事件。
深度学习技术也已应用于情绪原因识别。Cheng等使用长短期记忆网络来进行情绪原因检测,提出了一种新的记忆网络架构来对每个词的上下文进行建模。但是在之前的研究中,大都数都仅仅只是使用了个体情绪的文本内容信息。
发明内容
本发明的目的在于提供一种基于多任务联合学习的文本情绪原因识别系统,能够抽取出有效特征,并对特征进行抽象和组合,最终识别出引起情绪变化的文本子句。
为实现上述目的,本发明的技术方案是:一种基于多任务联合学习的文本情绪原因识别系统,包括:
数据预处理模块,用于对文本数据进行预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011138387.9/2.html,转载请声明来源钻瓜专利网。