[发明专利]一种基于深度学习的情绪原因识别方法及系统在审
申请号: | 202111445330.8 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114239565A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 何婷婷;范瑞;王逾凡;章哲铭;洪婕;戴汝峰;阿布都乃比江·库尔班 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 情绪 原因 识别 方法 系统 | ||
1.一种基于深度学习的情绪原因识别方法,其特征在于:首先,将一段文本D中的情绪de与这段文本中的任意语句组合构成新的文本数据Dcp;然后用新的文本数据Dcp训练情绪原因识别模型PECR-BERT,所述的情绪原因识别模型PECR-BERT包括基于Transformer的双向编码表示器BERT模型和两个全连接神经网络层;最后用训练后的情绪原因识别模型PECR-BERT识别文本中情绪de对应的原因语句dc。
2.根据权利要求1所述基于深度学习的情绪原因识别方法,其特征在于:将一段文本D中的情绪语句de与这段文本中的任意语句组合构成新的文本Dcp,包括对每个文本数据进行以下处理,
一段文本数据D={d1,d2,…,di,…,dn},di表示文本中的第i个语句,i=1,2,…,n,文本中预先标记有情绪语句de,在情绪语句de的一定距离内选择任意语句dj,作为de对应的待判断的原因语句,其中|j-e|≤r,0≤r≤n-1,e、j表示文本中语句的位置序号,r表示情绪语句de与语句dj之间的最大相对距离,通过在de前后一定距离内选择dj的方式构建得到文本Dcp={de,dj,d1,d2,…,di,…,dn},其中,r-e≤j≤r+e,1≤j≤n。
3.根据权利要求1所述基于深度学习的情绪原因识别方法,其特征在于:用文本Dcp训练情绪原因识别模型PECR-BERT,实现方式如下,
1)对文本Dcp处理得到输入文本I=[[CLS],de,[SEP],[CLS],dj,[SEP],d1,d2,…,di,…,dn],其中,[CLS]为结果判断标志符,第一个[CLS]用来判断语句dj是否为情绪语句de对应的原因语句,第二个[CLS]用来判断语句dj是否为原因语句,[SEP]为段落分隔标志符,分别用来分隔情绪语句de、待判断语句dj和整个文本段落;
使用BERT模型提供的词表对输入文本I进行分词,分词后的序列长度为(M+2),然后使用词嵌入技术得到对应的词向量序列表示输入文本I中的两个[CLS]标志符对应的词向量,xm表示第m个词的词向量,m=1,2,…M;
将序列X输入到BERT模型中,通过计算得到每个词的特征表示分别表示两个[CLS]标志符对应的输出,hi表示xi对应的输出;
2)通过第二个[CLS]标志符对应的输出预测dj是否为原因语句,实现过程如下,
其中Wc是一个矩阵,代表是全连接神经网络层的可训练参数,sigmoid表示激活函数,将一个数值映射到(0,1),使用带sigmoid激活函数的全连接网络层计算,得到语句dj是原因语句的分数yc,若yc≥0.5,语句dj是原因语句;
3)获得情绪语句de与语句dj之间的相对距离se,j,使用词嵌入处理将常数相对距离se,j映射到特征向量pe,j,将第一个[CLS]标志符对应的输出与相对距离特征向量pe,j拼接,然后计算语句dj是情绪语句de对应的原因语句的分数,具体实现过程如下,
ycp=sigmoid(Wcp[hcls1,pe,j])
其中Wcp是一个矩阵,代表是全连接神经网络层的可训练参数,sigmoid表示激活函数,通过全连接层和sigmoid激活函数计算,得到语句dj是情绪语句de对应的原因语句的分数ycp,若ycp≥0.5,语句dj为情绪语句de对应的原因语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111445330.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光学模组和电子设备
- 下一篇:一种人体检测装置及安全检测系统