[发明专利]基于多任务联合学习的文本情绪原因识别系统有效
申请号: | 202011138387.9 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112183064B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 廖祥文;李泽南;陈志豪;张艳茹;叶锴 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06F40/284;G06F40/30;G06F40/126;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 联合 学习 文本 情绪 原因 识别 系统 | ||
1.一种基于多任务联合学习的文本情绪原因识别系统,其特征在于,包括:
数据预处理模块,用于对文本数据进行预处理;
文本编码模块,提取文本内容上下文依赖关系,获取其隐层向量表示,作为文本子句信息的整体表示;
相对位置信息嵌入模块,从相对位置表示中学习出相对位置信息,并将其嵌入到文本子句向量中;
情绪分类子任务模块,通过引入情绪分类子任务,使得相对位置信息表示能帮助情绪识别任务精准的定位目标子句的位置;
情绪原因识别标签输出模块,用于分析文本子句之间的上下文关系,完成情绪原因识别的标签预测工作;
所述文本编码模块,使用双向长短时记忆神经网络学习文本中各个子句中词语的上下文关系的文本表示,利用注意力网络得到文本中每个词的注意力分布,并进行加权求和得到文本子句的句子级向量表示;所述相对位置信息嵌入模块,将相对位置表示向量输入残差网络学习新的相对位置信息,嵌入文本子句向量的方式为串联;所述情绪分类子任务模块,将包含相对位置信息的文本子句向量输入长短时记忆神经网络学习出每个子句的上下文关系的文本表示,采用softmax函数对所得到的文本向量处理,预测文本的情绪类别;所述情绪原因识别标签输出模块,先采用transform网络对输入的包含相对位置信息的文本子句向量进行编码,在对得到的文本子句上下文表示进行预测和标签遮掩得到全局标签,串联到文本子句上下文表示后,在输入到下一层transform网络中,对特征进一步编码得到最终的文本向量,预测文本中各个子句的情感原因标签;所述全局标签为将得到的文本子句上下文表示输入到softmax层,得到基于当前文本上下文表示向量的预测结果,并得到所有子句预测结果的全局标签向量,每个子句将全局标签上该子句的预测结果遮掩掉,即置为0,并将其串联在文本上下文表示后面。
2.根据权利要求1所述的基于多任务联合学习的文本情绪原因识别系统,其特征在于,所述数据预处理模块,对文本数据进行预处理的具体方式为:对文本数据进行分词、文本内容表示、生成相对位置表示向量、基于情绪词标注出文本中每个子句的相对位置,将文本中每个子句依据其情绪关键词的位置标注出相应文本子句在文本中相对位置。
3.根据权利要求2所述的基于多任务联合学习的文本情绪原因识别系统,其特征在于,所述数据预处理模块中文本内容表示使用的是发表在NLPCC2017年上通过word2vec方法训练110万中文微博语料库得到的词向量模型,在文本分词后的内容映射到低维的语义空间中获取词向量表示。
4.根据权利要求2所述的基于多任务联合学习的文本情绪原因识别系统,其特征在于,所述数据预处理模块中生成相对位置表示向量采用随机生成正太分布的50维向量表示其相对位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011138387.9/1.html,转载请声明来源钻瓜专利网。