[发明专利]基于门控卷积网络的在线论坛用户抑郁检测模型在审
申请号: | 202110713423.8 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113571177A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 饶国政;张越;丛庆 | 申请(专利权)人: | 天津大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 门控 卷积 网络 在线 论坛 用户 抑郁 检测 模型 | ||
1.基于门控卷积网络的在线论坛用户抑郁检测方法,其特征在于,利用基于门控卷积网络对在线论文用户进行抑郁检测的模型实现检测,该模型的检测步骤如下:
S1.帖子级操作
模型的输入通过多层带有门控单元的卷积神经网络,卷积神经网络利用有限的上下文信息来获取帖子表示的关键特征;
其中,帖子级操作的处理层包括两个卷积层和一个全局平均池;第一卷积层使用两个大小不同的卷积内核来获得抽象特征图,然后,具有门控单元的第二卷积层使用卷积核来获得不同的门控权重,应用所述门控权重与第一个卷积层生成的特征图进行逐元素乘积,以此获得帖子级别的表征;
每个单词由词嵌入矩阵Lω∈Rd×|V|表示,|V|是词汇量中的单词数,d是单词向量的维数,每条帖子表示为n个单词,分别为{ω1,ω2,...ωi...ωn},令xi∈Rd为与帖子中第i个单词相对应的d维单词向量,长度为n的帖子嵌入后表示为
X1:n=[x1,x2,...,xn]
第一卷积层中,使用CNN和多个不同宽度的卷积滤波器生成帖子的表示形式;将具有不同宽度的卷积滤波器视为提取器以获取的多粒度局部信息;使用不同窗口大小的多个卷积滤波器以获得多个特征图;
设K∈Rs×d是步长为1的卷积滤波器,应用于s个单词的窗口以产生新的特征,[xi+1,xi+2,...,xi+s-1]表示长度固定为s的窗口中的词嵌入,将两个向量串联起来即Xi:i+s-1,由Xi:i+s-1生成一个新的特征ai
ai=f(K*Xi:i+s+1+b)
其中,b∈R是偏置项,*表示卷积运算,f是激活函数LeakyReLU,该过滤器应用于帖子[X1:s,X2:s+1,...,Xn-s+1:n]中每个可能窗口的s个单词来生成特征图A,
A=[a1,a2,...,an-s+1]
其中,A∈R(n-s+1)×1表示通过不同大小的过滤器得到所有的特征图,然后将每个特征图A都作为输入传给第二卷积层;
第二卷积层包括卷积层和门控单元,用来生成不同的门控权重,包含一个核F∈Rh×1的卷积运算,用于提取特征图A,卷积核F以窗口h在特征a1上滑动,以此来生成门控权重;
其中,gl∈R,l=1,2,...,n-s+1,所有门控权重元素均由特征图A和卷积核F所生成,并组成门控权重矩阵G:
G=[g1,g2,…,gn-s+1]
其中,G∈R(n-s+1)×1,m为第二卷积层中的卷积核的数量,利用门控单元提取不同的门控权重矩阵G1,G2,...,Gm,然后通过门控权重矩阵G获得输出特征图O:
其中,是矩阵之间的按元素乘积,O∈Rm×(n-s+1);
第一卷积层的输出特征图O由门控权重矩阵G控制;
接着将第二个卷积层的输出特征图O输入到全局平均池化层,并连接所有输出以获取帖子的表征;
S2.用户级操作
将获得的帖子表征输入送到用户级操作处理中,使用与帖子级操作相同的方法,获得用户状态表征,然后将获得的用户状态表征传递到全连接的softmax图层,该softmax图层输出标签上的概率分布,从而实现检测;模型损失函数使用的是分类交叉熵,每个文档的目标情感分布记为pT,p为预测文档情感分布;
其中,T为训练数据,C为分类数,i是文档的索引,j是类别索引,训练的目的是使所有训练文档的pT和p之间的交叉熵的误差最小化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110713423.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种控制低碳奥氏体不锈钢特厚板晶粒度的方法
- 下一篇:熟化箱