[发明专利]一种基于CPC-ANN的文本情绪原因识别方法在审

申请号：	202111575527.3	申请日：	2021-12-21
公开（公告）号：	CN114004220A	公开（公告）日：	2022-02-01
发明（设计）人：	刘德喜;徐秀;万常选	申请（专利权）人：	刘德喜
主分类号：	G06F40/211	分类号：	G06F40/211;G06F40/284;G06F40/30;G06N3/04;G06N3/08
代理公司：	北京保识知识产权代理事务所(普通合伙) 11874	代理人：	姚天健
地址：	330013 江西省南昌市昌北国家经济***	国省代码：	江西;36
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 cpc ann 文本情绪原因识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于CPC-ANN的文本情绪原因识别方法，其特征在于，CPC-ANN模型主要分为五层：嵌入层、Bi-LSTM层、Transformer层、注意力层以及CNN输出层，所述方法应用于文本情绪原因识别，包括以下步骤：

S1、相对位置嵌入层，获取已标注原因子句和情绪子句的语料文本，得到文本每个子句的相对位置，再将子句转化为词嵌入矩阵，然后将相对位置嵌入到文本子句的每个词向量中；

S2、Bi-LSTM层，使用Bi-LSTM分别对每个输入的文本子句进行编码，得到融合词上下文的子句向量；

S3、Transformer层，使用Transformer分别对每个输入的文本子句进行编码，得到融合深层语义特征的子句向量；

S4、注意力层，将候选原因子句与其上下文子句融合，用注意力机制捕捉融合后的候选原因子句与情绪子句间的语义关系；

S5、CNN输出层，使用CNN对经注意力计算后的候选原因子句和情绪子句进行卷积，最大池化操作，抽取局部最大语义信息；然后将卷积后的候选原因子句和情绪子句拼接，通过线性分类器softmax分类，来判断该候选原因子句是否是文本情绪原因。

2.根据权利要求1所述的一种基于CPC-ANN的文本情绪原因识别方法，其特征在于：所述S1中，给定一个包含情绪和情绪原因的文本D＝{c₁,c₂,...,c_k}，该文本由k个子句组成，假设文本中包含唯一一个情绪子句c_e和至少一个对应的情绪原因子句c_a，子句c_i＝{w₁,w₂,...,w_n}由n个词组成；对于文本的子句c_i，1≤i≤k，首先通过Word2vec将每个单词w_t，1≤t≤n，映射到一个d维向量u_t∈R^d，并计算出子句c_i相对于情绪子句c_e的相对位置P_i；为了增强相对位置信息的作用，将子句的相对位置信息通过相加的方式嵌入到子句的每个词向量中，其如公式(1)所示：

x_t＝u_t+p_i (1)

因此，子句c_i表示为一个特征映射X_i＝{x₁,x₂,...,x_n}；将情绪子句c_e和情绪候选原因子句c_a的特征映射分别记为X_e＝{x_1e,x_2e,...,x_ne}和X_a＝{x_1a,x_2a,...,x_na}；

在将原始输入序列c_i转化为输入向量矩阵X_i后，因为原始的输入数据是长短不一的文本子句，每个序列c_i中含有的词语个数也不尽相同；为此，对训练语料中的原始输入序列长度进行统计，将所有输入序列用占位符补充至最大长度，将统一长度的输入序列输入到模型中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于刘德喜，未经刘德喜许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111575527.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种治疗皮肤病的药物组合物及其制备方法和应用
下一篇：一种治疗猪大肠杆菌病的七味石榴皮散

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于CPC-ANN的文本情绪原因识别方法在审

专利文献下载