[发明专利]一种短文档情感原因对提取方法、系统、存储介质在审

专利信息
申请号: 202011187722.4 申请日: 2020-10-30
公开(公告)号: CN112364127A 公开(公告)日: 2021-02-12
发明(设计)人: 袁洁莹;邹东升;宋浩浩;胡蕾 申请(专利权)人: 重庆大学
主分类号: G06F16/33 分类号: G06F16/33;G06F40/211;G06K9/62
代理公司: 重庆市信立达专利代理事务所(普通合伙) 50230 代理人: 陈炳萍
地址: 400030 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文档 情感 原因 提取 方法 系统 存储 介质
【说明书】:

发明属于自然语言处理的情感分析技术领域,公开了一种短文档情感原因对提取方法、系统、存储介质,所述短文档情感原因对提取系统包括:情感/原因提取模块、第一词级别编码器模块、词级别注意力模块、子句级别编码器模块、情感/原因预测模块、情感原因对提取模块、第二词级别编码器模块、位置编码器模块和情感原因对预测模块。本发明针对目前情感/原因提取中,忽略情感预测时,子句在整个文档中的表达与原因的关系,提出新的利用情感预测原因的结构;在情感原因对提取时,对于位置信息的利用并不充分,提出新的利用位置信息的结构,帮助机器更加精准的提取短文本的情感原因对。本发明可以帮助机器更加精准的提取短文本的情感原因对。

技术领域

本发明属于自然语言处理的情感分析技术领域,尤其涉及一种短文档情感原因对提取方法、系统、存储介质。

背景技术

目前,在传统短文档情感原因提取的研究中,通常是给定情感标签预测导致其情感的潜在的原因,给定情感标签限制了其在现实世界的应用,最近的研究提出直接预测出短文档的情感原因对,即不给定情感标签的前提下,预测文档潜在的情感以及导致其情感的潜在的原因。

由于最近的情感原因对提取的表现并不是很好,其F1只有0.6128,主要原因在于在情感/原因提取阶段,原因预测的准确率偏低,以及情感原因对提取阶段并未充分利用情感原因对的位置关系,以及使用的是200d的预训练词向量,导致其结果F1较低。通过就上面的三点进行优化,使其F1可以达到0.6816。

通过上述分析,现有技术存在的问题及缺陷为:现有的情感原因对提取过程中,在情感/原因提取阶段,原因预测的准确率偏低,以及情感原因对提取阶段并未充分利用情感原因对的位置关系,以及使用的是200d的预训练词向量,导致其结果F1较低。

发明内容

针对现有技术存在的问题,本发明提供了一种短文档情感原因对提取方法、系统、存储介质。

本发明是这样实现的,一种短文档情感原因对提取方法,所述短文档情感原因对提取方法,包括:

步骤一,第一词级别编码器模块将短文本中的每一子句送入词级别编码器,词级别注意力模块,通过注意力机制,引入了当前预测词对应输入词的上下文信息以及位置信息,计算句中的词的权重,并将每一句中词的权重和累加,得到新的文本向量;

步骤二,子句级别编码器模块将短文本的子句表达式送入子句级别编码器,情感/原因预测模块通过子句级别编码器获取不同子句之间的结构性信息更新子句表示后,分别通过softmax函数得到情感或原因的分类概率;

步骤三,情感/原因笛卡尔乘积配对模块将上一阶段预测的情感/原因子句按笛卡尔乘积一一配对,得到一个只有情感与原因交替出现的文本,同时计算情感/原因所在句子的相对位置,得到位置向量;

步骤四,第二词级别编码器模块将通过笛卡尔积配对后文本的每一子句送入词级别编码器,用于得到每个子句中词的上下文信息;位置编码器模块将位置向量送入位置编码器,用于得到在每一个短文本中情感子句与原因子句的位置信息;

步骤五,情感原因对预测模块,通过词级别编码器与位置编码器分别获取每个子句中词的上下文信息与每一个短文本中情感子句与原因子句的位置信息后,将其分别通过softmax函数得到情感或原因的分类概率。

进一步,所述步骤一中,第一词级别编码器模块采用BiLSTM作为最基础的词级别编码器,在每一个时间步,LSTM模型是由t时刻的输入词Xt,细胞状态ct,临时细胞状态隐层状态ht,遗忘门ft,记忆门it,输出门ot组成;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011187722.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top