[发明专利]一种基于轻量化卷积神经网络的细粒度观点挖掘方法在审
申请号: | 202010125716.X | 申请日: | 2020-02-27 |
公开(公告)号: | CN111353043A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 冯梁铭;蔡铭 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 量化 卷积 神经网络 细粒度 观点 挖掘 方法 | ||
本发明公开了一种基于轻量化卷积神经网络的细粒度观点挖掘方法,该方法首先将作为输入的评论和评价目标词,经过处理得到评论语句的矩阵表达和目标词特征向量;然后目标词特征向量通过多个匹配模块与句子特征表达进行多轮次融合并抽取目标词相关的情感特征;最后利用池化层得到与目标词相关的特定情感信息特征向量,交由全连接网络构成的分类器进行细粒度的观点极性判断。本发明有效利用卷积神经网络计算并行度高的特点,通过设计合理高效的轻量化卷积网络层结构,提高了细粒度语义分析与观点挖掘模型的计算效率(提升了5‑6倍),降低了模型参数量;轻量化的模型设计有利于模型在低耗能的终端设备上进行部署,便于算法的落地与应用。
技术领域
本发明属于细粒度观点挖掘领域,尤其涉及一种基于轻量化卷积神经网络的细粒度观点挖掘方法。
背景技术
观点挖掘旨在于了解评论语句中特定实体的评价/观点极性。目前主流的方法通常是基于递归神经网络设计的模型。递归神经网络在自然语言处理领域有着广泛的应用,它可以有效地提取目标实体和与其相关的评价上下文之间的语义关系。但是递归神经网络采用的是序列计算的方式,无法并行处理评论语句中多个单词。另外,这类模型的参数量和计算量均较大,不适合在移动端进行部署。近年来,卷积神经网络在多项自然语言处理任务中取得了巨大的进展。卷积神经网络的多个卷积核可以充分地并行计算。然而在观点挖掘领域,鲜有基于卷积神经网络的模型。实际上,卷积神经网络能够有效地提取文本中的局部信息。通过设计合理的门控机制和多层网络的堆叠,卷积神经网络能够有效对句子进行建模处理。因此,本发明主要设计了一种基于轻量化卷积神经网络的轻量化细粒度语义分析与观点挖掘方法,在保证观点极性分类效果不发生下降的前提下,尽可能的降低模型的计算量和参数量,便于模型在终端设备上进行部署和应用。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于轻量化卷积神经网络的细粒度观点挖掘方法。
本发明的目的是通过以下技术方案来实现的:一种基于轻量化卷积神经网络的细粒度观点挖掘方法,包括以下步骤:
(1)输入评论语句和评价目标词以及对应的观点极性,采用词嵌入技术处理得到评论语句的矩阵表达S和目标词的特征向量va。
(2)将步骤(1)得到的评论语句的矩阵表达S和目标词的特征向量va输入细粒度观点挖掘模型并结合步骤(1)输入的观点极性进行训练;所述细粒度观点挖掘模型由匹配模块、池化层、分类器组成;其中,n个匹配模块通过残差连接堆叠,评论语句的矩阵表达S和目标词的特征向量va输入第一个匹配模块,由最后一个匹配模块输出评论语句的矩阵表达Sn,然后经过池化层得到目标词相关的情感特征vf,再输入由全连接网络构成的分类器得到观点极性判断结果。
(3)将待测评论语句和目标词经过步骤(1)处理得到评论语句的矩阵表达和目标词的特征向量,然后输入步骤(2)训练得到的细粒度观点挖掘模型,得到观点极性判断结果。
进一步地,所述步骤(1)具体为:首先利用词嵌入技术将输入评论语句和目标词中的每一个单词转换为对应的向量表达;然后对评论语句的向量表达使用卷积神经网络进行一维卷积操作,得到评论语句的矩阵表示S;同时对目标词的向量表达进行卷积和最大池化操作,得到目标词的特征向量va。
进一步地,所述观点极性包括积极、中性和负面等。
进一步地,所述步骤(2)中训练细粒度观点挖掘模型采用的优化函数为随机梯度下降,损失函数为交叉熵损失。
进一步地,所述步骤(2)中所述池化层采用max-over-time pooling的方法。
进一步地,所述步骤(2)中所述由全连接网络构成的分类器采用softmax回归的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010125716.X/2.html,转载请声明来源钻瓜专利网。