[发明专利]一种方面级情感分析的预训练语义组合细化方法在审
申请号: | 202310463820.3 | 申请日: | 2023-04-26 |
公开(公告)号: | CN116468049A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 朱新华;旷中洁;提平;彭琦 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F18/241;G06N3/045;G06N3/0442;G06N3/0464;G06N3/048;G06N3/0985 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 覃永峰 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 方面 情感 分析 训练 语义 组合 细化 方法 | ||
1.一种方面级情感分析的预训练语义组合细化方法,其特征在于包括以下步骤:
S1.将评语句子X与其待评测的方面目标A组成一个句子对,送入一个预训练神经网络语言模型BERT中,得到方面级情感分析的预训练语义H,然后分别将H送入步骤S2的全局语义细化模块与步骤S3的多粒度局部语义细化模块;
S2.将预训练语义H送入一个串行的多层逐点卷积层,进行逐点语义细化,得到全局语义细化的初级语义Hg,并将Hg和预训练语义H进行组合,得到组合全局细化语义然后将的平均池化向量与中分类符的隐藏状态相连接,通过一个门控机制组合成全局语义细化的输出向量Zg,最后转步骤S4;
S3.将预训练语义H分别送入三个窗口尺寸不相同且连续的并行卷积神经网络,进行多粒度局部语义细化,并将三个并行卷积神经网络的输出进行最大化池化,然后将三个并行卷积神经网络的最大化池化向量连接起来,得到多粒度局部语义细化的输出向量Zl;
S4.将全局语义细化的输出向量Zg与多粒度局部语义细化的输出向量Zl组合起来,得到待评测的方面目标A的最终情感分类向量Z,然后将Z送入一个全连接的分类层,对待评测的方面目标A进行情感预测;
S5.使用步骤S1到步骤S4,在方面级情感分析数据集Ψ的训练集上,对预训练神经网络语言模型BERT进行微调;
S6.使用步骤S5微调的BERT模型,并采用步骤S1到步骤S4,对方面级情感分析数据集Ψ的测试集中的方面目标进行情感极性分类;
所述BERT模型是指Google AI Language提出的Bidirectional EncoderRepresentations from Transformers预训练神经网络语言模型;
所述步骤S1具体包括:
S1.1将评语句子X与其待评测的方面目标A组成一个如下形式的BERT句子对输入序列S:
其中,w[cls]为BERT模型的分类符,w[sep]为BERT模型的分隔符,为评语句子X在BERT中的词序列,为方面目标A在BERT中的词序列,n为句子对输入序列S中词的个数,dw为BERT中词编码的维度;
S1.2将S送入BERT模型进行处理,得到方面级情感分析的预训练语义H:
H=BERT(S)={h1,h2,h3,...,hn}∈Rn×d (2)
其中,{h1,h2,h3,…,hn}为S在BERT中的隐藏状态序列,BERT(·)表示一个BERT模型,d为BERT模型的隐藏状态的维度;
所述步骤S2具体包括:
S2.1将预训练语义H送入一个串行的多层逐点卷积层MPC(Multi-layer Point-wiseConvolutions)中,进行逐点语义细化,得到全局语义细化的初级语义Hg,计算过程如下:
其中,MPC中的卷积窗口大小为1,MPC中的卷积核数量设置为与BERT中隐藏状态的维数d相同,σ1(·)表示整流线性单元(ReLU)激活函数,符号“*”表示卷积层中所有卷积核的卷积运算,与分别是第i个卷积层的权重矩阵与偏置向量,分别为第i个与第i-1个逐点卷积层的输出;当i等于1时:即MPC的初始输入是BERT输出的预训练语义H;当i等于m时,得到全局语义细化的初级语义Hg,即m是MPC中逐点卷积的层数,它是一个可学习的动态超参数,所述动态超参数是指对于不同的数据集可以取不同值的超参数;
S2.2将Hg和预训练语义H进行组合,得到组合全局细化语义计算过程如下:
设置一个组合选择的动态超参数choice,如果choice为连接运算connection_operation,则由公式(4)进行组合,如果choice为残差网络residual_network,则由公式(5)进行组合:
其中,Residual(·)表示一个残差网络,MHSA(·)表示一个多头自注意力(Multi-HeadSelf-Attention),linear(·)表示一个将维度从n×2d变换为n×d的线性变换层(LinearTransform Layer),公式(4)中的+表示逐点相加,公式(5)中的;表示连接运算;
S2.3将的平均池化向量与中分类符的隐藏状态相连接,通过一个门控机制组合成全局语义细化的输出向量Zg,计算过程如下:
g=σ2(wsq+bs)∈R2d (7)
Zg=g⊙q∈R2d (8)
其中,表示对进行平均池化,σ2(·)表示sigmoid激活函数,ws∈R2d×2d是门控机制的权重,bs是门控机制的偏置,q是的平均池化向量与相连接后的组合向量,g是q的门控向量,⊙表示逐元素相乘;
所述步骤S3具体包括:
S3.1将预训练语义H分别送入三个窗口尺寸不相同且连续的并行卷积神经网络,进行多粒度局部语义细化,其中将三个并行卷积神经网络的卷积核的数目都设置为BERT隐藏状态维数d的三分之一,并且将三个并行卷积神经网络的窗口尺寸s1、s2、s3都设置为动态超参数,则第i个并行卷积神经网络处理H后,得到一个如下所示的卷积输出语义:
其中,si为第i个并行卷积神经网络的窗口尺寸,Ck为第k个卷积核处理H后得到的卷积向量,并且Ck,以及Ck中的第j个元素cj计算方法如下:
其中,为第i个并行卷积神经网络的卷积核的权重,为第i个并行卷积神经网络的第k个卷积核的偏置,表示卷积运算,表示从H的隐藏状态序列{h1,h2,…,hn}∈Rn×d中的hj开始,切分出一个子序列
S3.2三个并行卷积神经网络分别按照步骤S3.1中的公式(9)到公式(11),对H进行处理,分别得到三个卷积神经网络的输出语义然后对分别进行最大化池化,并将它们的池化向量连接起来,得到多粒度局部语义细化的输出向量Zl,计算过程如下:
其中,表示第i个Zl,表示对进行最大化池化;
所述步骤S4具体包括:
S4.1将Zg与Zl组合起来,得到待评测的方面目标A的最终情感分类向量Z,计算过程如下:
Z=[Zg;Zl]∈R3d (14)
S4.2将Z送入一个全连接的分类层,对待评测的方面目标A进行情感预测,计算过程如下:
o=WoZ+bo (15)
其中,是情感极性的表示矩阵,是一个偏置向量,dk是情感极性类别的个数,Ω是情感极性类别的集合,y是一个被预测的情感极性,是表示所有情感极性置信分数的向量,P(y|Z)表示求待评测的方面目标A的分类向量Z在情感极性y上的预测概率,y′为Ω中任意一个情感极性,exp(·)表示以e为底的指数函数;
所述步骤S5中,对预训练神经网络语言模型BERT进行微调,使用如下的交叉熵损失函数计算损失误差:
其中,T是方面级情感分析数据集Ψ的训练集,|T|表示集合T的大小,yi是T中第i个方面目标在评语中的情感极性标签,Zi是T中第i个方面目标的最终情感分类向量;
微调目标是按公式(17)最小化T中所有方面目标的交叉熵损失误差;
所述步骤S6中,对方面目标采用如下公式进行情感极性分类:
其中,y*为待评测的方面目标A最终评定的情感极性,表示返回使得P(y|Z)为最大值的情感极性,P(y|Z)使用公式(16)计算。
2.根据权利要求1所述的一种方面级情感分析的预训练语义组合细化方法,其特征在于:
对步骤S2.1所述的MPC中逐点卷积的层数的动态超参数m、步骤S2.2所述的组合选择的动态超参数choice,以及步骤S3.1所述的三个并行卷积神经网络的窗口尺寸的动态超参数s1、s2、s3,采用联动测试的方式进行组合灵敏度分析,所述组合灵敏度分析是指将多个动态超参数进行组合,对数据集Ψ的性能进行测试,得出准确率-组合曲线,从中得到一组最佳的动态超参数组合,并将该最佳动态超参数组合设置为数据集Ψ的最终动态超参数,其中动态超参数m的取值范围为{2,3,4,5},动态超参数choice的取值范围为{residual_network,connection_operation},动态超参数s1、s2、s3的取值范围为{[2,3,4],[3,4,5],[4,5,6],[5,6,7]};
所述最佳的动态超参组合是指使得数据集Ψ的性能达到最高值的动态超参组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310463820.3/1.html,转载请声明来源钻瓜专利网。