[发明专利]一种融合外部知识与交互注意力机制的视角级文本情感分类方法及系统有效

专利信息
申请号: 202011184688.5 申请日: 2020-10-30
公开(公告)号: CN112199504B 公开(公告)日: 2022-06-03
发明(设计)人: 廖祥文;曾梦美;邓立明;陈甘霖;陈开志 申请(专利权)人: 福州大学
主分类号: G06F16/35 分类号: G06F16/35;G06F40/247;G06F40/30;G06N3/04
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 钱莉;蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 外部 知识 交互 注意力 机制 视角 文本 情感 分类 方法 系统
【权利要求书】:

1.一种融合外部知识与交互注意力机制的视角级文本情感分类方法,其特征在于,包括以下步骤:

构建带有外部知识的文本序列内容,同时引入哨兵向量改善外部知识对模型的误导作用;

构建带有交互信息及位置信息的记忆内容;

构建记忆内容的多层注意力表示,并将注意力结果与门控循环单元非线性结合,最终形成视角级文本情感特征表示;

采用分类函数得到文本最终的情感分类结果;

所述构建带有交互信息及位置信息的记忆内容具体包括以下步骤:

首先对结合外部知识的单词向量表示和视角词向量进行平均池化:

式中,cavg表示平均单词向量表示,tavg表示平均视角词向量表示,n表示输入文本的单词总数,m表示视角词的单词个数;

通过下式计算视角对文本注意力的文本表示Si的注意力权重αi和文本对视角注意力的文本表示Ai的注意力权重βi

其中,

式中,Wt、Wc表示待学习的权重参数矩阵,bt、bc表示待学习的权重参数向量;

通过下式计算交互注意力层的最终文本表示

其中,

式中,λ表示控制Si和Ai重要程度的超参数;

将上下文单词与视角词的位置距离定义为二者之间的单词数;将第i个单词对视角词的贡献程度定义为第i个单词的位置权重wi,计算如下式所示:

其中,

式中,t表示视角词的位置,tmax表示输入文本的单词总数,mi为融合了交互信息与位置注意力权重的记忆内容。

2.根据权利要求1所述的一种融合外部知识与交互注意力机制的视角级文本情感分类方法,其特征在于,所述构建带有外部知识的文本序列内容,同时引入哨兵向量改善外部知识对模型的误导作用具体为:

首先通过Glove模型将分词处理后的文本数据转换为向量表示;

接着利用BiLSTM从文本提取语义特征;

利用动态注意力机制将BiLSTM的隐藏向量表示与外部同义词的向量表示相结合,同时引入哨兵向量来改善外部知识对模型的误导作用,得到与外部知识结合的单词向量表示

3.根据权利要求2所述的一种融合外部知识与交互注意力机制的视角级文本情感分类方法,其特征在于,所述引入哨兵向量来改善外部知识对模型的误导作用,得到与外部知识结合的单词向量表示具体为:

通过下式计算哨兵向量st

式中,σ(*)表示logistic sigmoid函数,Wb、Ub表示待学习的权重参数矩阵,xt表示当前输入的文本内容,表示上一隐藏状态的输出;

通过下式计算同义词向量tk和哨兵向量st的注意权重βt

其中,

式中,tkb、skb、bt、bs表示待学习的权重参数向量,Wt、Ws、Wht、Whs表示待学习的权重参数矩阵;

通过下式计算结合外部知识的单词向量表示

其中,

式中,k表示同义词,Synvi表示同义词向量集合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011184688.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top