[发明专利]一种基于残差注意力的方面级情感分析方法有效

专利信息
申请号: 202010664010.0 申请日: 2020-07-10
公开(公告)号: CN111814450B 公开(公告)日: 2023-08-11
发明(设计)人: 熊庆宇;吴超;高旻;王凯歌;易华玲;杨正益;文俊浩;张致远;吴丹 申请(专利权)人: 重庆大学
主分类号: G06F16/35 分类号: G06F16/35;G06F40/205;G06F40/279;G06N3/0464;G06N3/0455;G06N3/047;G06N3/048
代理公司: 重庆西南华渝专利代理有限公司 50270 代理人: 郭桂林
地址: 400044 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 注意力 方面 情感 分析 方法
【权利要求书】:

1.一种基于残差注意力的方面级情感分析方法,其特征在于,所述方面级情感分析方法包括以下步骤:

S1:对输入的文本和所有的方面目标信息进行编码,将文本和所有的方面目标信息转变成张量形式,得到文本编码;其中设定输入的文本集合为包含n个单词,文本序列的向量表示为c'∈Rn×d;设定待预测的方面目标集合为包含m个单词,待预测方面目标的向量表示为a'∈Rm×d;设定其余方面目标集合为O={o1,o2,...,ot},共包含t个其余方面目标,代表其余方面目标集合中的第i个,包含li个单词,第i个其余方面目标的向量表示为其中d为词向量的维度;

S2:利用相对位置编码函数对待预测的方面目标在文本中的相对位置信息进行编码,并将得到的位置编码与S1中得到的文本编码进行融合;相对位置编码函数为:

将位置编码融入到文本编码中的得到融合了位置信息的文本编码函数为:

cp=c'Δexpand(p)

其中,i和j分别代表待预测方面目标首末单词在文中的位置,r和rl是以待预测方面为界,右半文本中离方面目标最近一个其余方面目标的首单词索引以及长度;p∈Rn×1是整个文本相对于待预测方面的位置编码,Δ代表张量的相对位置元素相乘,cp∈Rn×d就是融合了位置信息的文本编码,expand(*)为维度扩展;

S3:利用注意力机制对待预测的方面目标和步骤S2中融入位置编码的文本编码进行处理;

对待预测的方面目标的处理公式为:

ha=tan(Conv1d(a'|e,f,q,p,s))

h′a=MaxPool1d(ha|s')

其中,e、f、q、p、s和s'分别是卷积和池化操作的参数,ha、h′a分别代表卷积操作后的输出以及最大池化层操作后的输出;

对融入位置编码的文本编码进行处理的公式为:

hi=Wc·(cp)T+bc

其中Wa∈Rf×f,ba∈Rf×1,WC∈Rf×d,bc∈Rf×1是模型参数,Sa∈Rn×1是注意力机制得到的注意力矩阵,k为卷积核的数量值,为利用k个卷积核得到的输出hi代表文本序列加上加上权值参数后的输出,fi代表k个卷积核得到的输出加上权值参数后的结果;

然后对注意力矩阵进行处理公式为:

c”=tan(cpΔexpand(sa))

cr=relu(cp+c”)

其中,Δ代表张量的相对位置元素相乘,expand(*)为维度扩展,c”代表文本序列和注意力矩阵融合后的结果;

S4:利用残差机制将S3中处理后得到的编码与融入位置信息的文本编码进行结合,作为融合待预测方面目标信息的文本编码;

S5:利用卷积神经网络提取其余方面目标中的特征信息,与步骤S1中得到的文本编码进行交互处理,然后从步骤S4得到的文本编码中过滤,得到最终面向方面级情感分析的特征;

提取其余方面目标信息中的特征信息表示为O'={o′1,o′2,...,o′t},对其进行处理,处理函数如下:

g′o=Wo*oe+bo

lo=sigmoid(conv(c')+g′o)

其中,Wo和bo为模型参数,lo为其余方面目标提取到的信息特征,oe代表多个其余目标方面提取到的特征信息均值化操作的结果,g′o代表oe加上权值参数后的结果;

得到最终面向方面级情感分析的特征的处理公式为:

hc=tan(conv(cr))

h′c=tan(conv(cr)+g')-lo

g'=Wg*he+bg

ho=maxpool(hc×h′c)

其中,Wg和bg为模型参数,he为利用k个不同卷积核得到并在原维度上进行叠加得到的he∈R(k*f),hc代表对经过注意力机制处理后的文本序列进行卷积操作,g'代表待预测的方面信息加上权值参数后的输出,h′c代表在提取到的文本信息和待预测的方面信息进行融合同时从其中过滤掉其余方面的信息,ho代表将通过注意力机制提取到的文本信息和过滤后的文本信息进行融合,并使用最大池化层来提取特征信息;

S6:利用最大池化层、全连接层和Softmax层对步骤S5过滤后的文本编码进行处理,得到最终结果,得到最终结果的处理公式为:

hm=tan(Wm·ho+bm)

其中,Wm和bm为模型参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010664010.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top