[发明专利]基于特征融合与注意力机制的医疗问答文本情感分析方法在审
申请号: | 202310288242.4 | 申请日: | 2023-03-23 |
公开(公告)号: | CN115994542A | 公开(公告)日: | 2023-04-21 |
发明(设计)人: | 胥备;杨晓峰;付晓堃;任雅靖 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/166;G06N3/08;G06F18/22;G06F18/24 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 曹洪 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 融合 注意力 机制 医疗 问答 文本 情感 分析 方法 | ||
1.基于特征融合与注意力机制的医疗问答文本情感分析方法,其特征在于,包括:
将医疗问答文本通过数据分割划分为患者问题文本和医生答案文本,并进行预处理;
将预处理后的患者问题文本和医生答案文本分别经过ALBERT预训练模型得到各自对应的文本表示向量;
将患者问题文本以及医生答案文本的文本表示向量分别输入到TextCNN和BiGRU中得到各自文本的局部特征向量和全局特征向量;
将局部特征向量和全局特征向量拼接得到患者问题文本和医生答案文本的综合语义表示向量,同时通过患者问题文本和医生答案文本的综合语义表示向量来进行构建语义交互信息的匹配矩阵;
通过双向注意力机制结合所述匹配矩阵得到问题文本和答案文本的情感表示向量,将问题文本和答案文本的情感表示向量拼接得到最终医疗问答文本的情感表示向量;
将最终医疗问答文本情感表示向量输入到softmax分类器中进行情感分类,得到医疗问答文本的情感分类的概率。
2.如权利要求1所述的基于特征融合与注意力机制的医疗问答文本情感分析方法,其特征在于:将患者问题文本以及医生答案文本的文本表示向量输入到TextCNN中得到各自文本的局部特征向量包括,
嵌入层EmbeddingLayer:将输入的单词序列转换为单词向量表示;
卷积层ConvolutionLayer:使用多个不同大小的卷积核对单词向量序列进行卷积操作,提取局部的特征,对于每个卷积核,会生成一组卷积特征图,表示不同的局部特征,具体公式如下:
;
其中,
池化层PoolingLayer:对于每个卷积特征图,使用Max-Pooling操作对特征值进行汇总,得到一个固定长度的向量表示,具体公式如下:
其中,
3.如权利要求1所述的基于特征融合与注意力机制的医疗问答文本情感分析方法,其特征在于:将患者问题文本以及医生答案文本的文本表示向量输入到BiGRU中得到各自文本的全局特征向量包括,
输入序列中的每个单词向量经过BiGRU的正向传播和反向传播,得到正向和反向的隐藏状态向量;
将正向和反向的隐藏状态向量拼接,得到当前时间步的全局特征向量;
重复拼接正向和反向的隐藏状态向量直到处理完整个输入序列,得到所有时间步的全局特征向量。
4.如权利要求1所述的基于特征融合与注意力机制的医疗问答文本情感分析方法,其特征在于:所述匹配矩阵包括,
患者问题文本和医生答案文本之间的语义交互信息;
通过以下公式计算得到问题文本和答案文本的语义交互信息的匹配矩阵:
其中,M为包含了语义交互信息的匹配矩阵,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310288242.4/1.html,转载请声明来源钻瓜专利网。