[发明专利]基于位置感知互注意力网络模型的属性级情感分类方法有效
申请号: | 201910751449.4 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110489554B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 相艳;张周彬;余正涛;郭军军;黄于欣;王红斌 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/247;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 位置 感知 注意力 网络 模型 属性 情感 分类 方法 | ||
本发明涉及基于位置感知互注意力网络模型的属性级情感分类方法,属于计算机及信息技术领域。本发明首先,利用两个LSTM网络对拼接位置信息的上下文和属性进行独立编码,然后,对上下文隐藏层的输出再次拼接位置信息,属性隐藏层的输出再次拼接属性的输入向量,接着,利用注意力机制让属性和上下文互作用学习获得更加有效的表示,最后,将上下文和属性进行拼接送入sofmax分类器中进行情感分类。该方法在SemEval 2014 Task4的Laptop和Restaurant两个不同领域的语料上进行了实验,均获得了比较好的结果。
技术领域
本发明涉及基于位置感知互注意力网络模型的属性级情感分类方法,属于计算机及信息技术领域。
背景技术
属性级情感分类中细粒度情感分类任务,旨在准确不同属性的情感极性。解决属性情感分类的传统机器学习方法包括语法规则和支持向量机(SVM)的方法,这些方法大多需要大量人工特征,包括情感词典、解析树等。这类方法的性能很大程度上受限于人工特征的质量。
近些年,随着深度学习的发展,神经网络在NLP中得到了广泛的应用。越来越多的学者提出利用深度学习技术。前期一些学者提出利用深度学习和传统的方法相结合处理属性级情感分类的思路。Nguyen和Shirai提出基于循环神经网络和句法分析树的方法进行属性情感分类。Dong等人提出一种自适应的循环神经网络应用于文本情感分类。这些方法均加入了深度学习的方法进行特征提取,相比于传统的方法取得了比较好的性能,但是,它们需要借助情感词典、句法分析树等方法的辅助,且网络结构相比比较复杂。为了克服这些缺陷,本发明提出了一种基于位置感知互注意力网络模型的属性级情感分类方法。
发明内容
本发明提供了基于位置感知互注意力网络模型的属性级情感分类方法,将属性和拼接位置向量的上下文向量进行独立编码,上下文隐藏层再次拼接位置向量,将隐层的输出经过初始化表示,计算得分、注意力权重计算,获得上下文和属性的最终有效表示;本发明能提升分类模型的准确性。
本发明的技术方案是:一种基于位置感知互注意力网络模型的属性级情感分类方法,首先进行语料预处理,针对英文语料,遍历全部语料查找出所有不同的词构建一个词典文件;然后,采用Google提供的Word2vec工具进行词向量300维的训练,上下文、属性、位置向量的计算;然后进行特征提取,利用两个LSTM网络对属性和拼接位置向量的上下文向量进行独立编码,上下文隐藏层再次拼接位置向量,强化位置信息的重要性;接着属性和上下文互动学习,计算它们各自的注意力权重,生成有效表示;最后,将属性和上下文生成的有效表示进行拼接作为最终的表示并送入softmax分类器中进行情感分类。
作为本发明的优选方案,所述基于位置感知互注意力网络模型的属性级情感分类方法的具体步骤如下:
Step1、词典的构建:英文文本不同于中文文本,它无需分词可以直接训练词向量,每个单词是一个独立的个体,表示独立的含义;将语料包含的所有词遍历后,去掉重复词,保证每个单词只出现一次,然后给每个单词赋予一个唯一的地址,保存到一个文本中,构成一个词典;供后续对应词向量的调用;
Step2、语料的数值化、位置信息的处理:将原始语料转化成数值方便后期的处理,将上下文和属性依次遍历,分别计算出它们各自的最长的长度max_context_len,max_aspect_len,然后利用词典将遍历到的词用它们的词典中对应的地址进行填充,达不到最长的长度的利用0进行填充,保证每条上下长度都为max_context_len,每条属性的长度都为max_aspect_len保持数据一致性,构成上下文和属性的序列,保存到文件中;
对位置信息的处理方法为:
1)检索到属性词所在的位置i,设置该位置的权重为0;
2)以属性词为中心,在属性词的两侧设置两个工作指针,分别依次计算属性词左右两侧单词和属性词之间的相对位置的值li;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910751449.4/2.html,转载请声明来源钻瓜专利网。