[发明专利]基于双通道三维卷积神经网络的新生儿疼痛表情识别方法在审
申请号: | 201810145292.6 | 申请日: | 2018-02-12 |
公开(公告)号: | CN108363979A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 卢官明;耿惠惠;李晓南;闫静杰;卢峻禾 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新生儿 卷积神经网络 双通道 表情识别 三维 疼痛 面部表情 视频片段 疼痛评估 视频库 特征图 辅助系统 技术支撑 拓展应用 网络模型 序列输入 灰度化 灰度图 帧图像 帧序列 剪辑 帧长 视频 表情 采集 保存 网络 开发 | ||
1.一种基于双通道三维卷积神经网络的新生儿疼痛表情识别方法,其特征在于,该方法包括以下步骤:
(1)采集新生儿不同状态下的视频片段,按疼痛程度将视频分为n类表情,其中,n为正整数,建立新生儿面部表情视频库;
(2)将所述面部表情视频库中的每一个视频片段剪辑成l帧长的帧序列,对每一帧图像进行灰度化,并提取LBP特征图;
(3)构造一种双通道三维卷积神经网络;
(4)将所述灰度图序列及LBP特征图序列输入所述双通道三维卷积神经网络,对网络进行训练、调优,保存已训练的网络模型;
(5)将测试视频片段输入到已训练的网络模型进行疼痛表情分类,输出识别结果。
2.根据权利要求1所述的基于双通道三维卷积神经网络的新生儿疼痛表情识别方法,其特征在于,步骤(3)中,所述双通道三维卷积神经网络包括特征提取部分和特征融合与分类识别部分。
3.根据权利要求2所述的基于双通道三维卷积神经网络的新生儿疼痛表情识别方法,其特征在于,所述特征提取部分包括三维卷积神经网络通道一和三维卷积神经网络通道二构成,所述通道一和通道二由输入层、卷积层1、池化层1、卷积层2、池化层2、卷积层3、池化层3、卷积层4、池化层4、卷积层5、池化层5、全连接层组成,其中所述通道一用于对l帧长的灰度图序列进行处理,所述通道二对l帧长的LBP特征图序列进行处理;所述特征融合和分类识别部分包括串接层和分类层。
4.根据权利要求3所述的基于双通道三维卷积神经网络的新生儿疼痛表情识别方法,其特征在于,所述通道一和通道二的具体结构为:
第一层为输入层,将输入的每一帧灰度图或LBP特征图归一化成h×w像素,其中,h、w为正整数;
第二层为卷积层1,采用n1个d1×k1×k1的三维卷积核对l帧长的灰度图序列或LBP特征图序列进行卷积运算,输出n1个特征图组,每个特征图组包含l1个大小为h1×w1的特征图,其中,d1为时间维大小,k1×k1为空间维大小,n1、d1、k1、l1、h1、w1为正整数;
第三层为池化层1,采用d2×k2×k2的池化核对卷积层1输出的特征图组进行下采样操作,输出n1个特征图组,每个特征图组包含l2个大小为h2×w2的特征图,其中,d2为时间维大小,k2×k2为空间维大小,d2、k2、l2、h2、w2为正整数;
第四层为卷积层2,采用n2个d1×k1×k1的三维卷积核对池化层1输出的特征图组进行卷积运算,同时进行补零操作,输出n2个特征图组,每个特征图组包含l2个大小为h2×w2的特征图,其中,n2为正整数;
第五层为池化层2,采用d2×k2×k2的池化核对卷积层2输出的特征图组进行下采样操作,输出n2个特征图组,每个特征图组包含l3个大小为h3×w3的特征图,其中,l3、h3、w3为正整数;
第六层为卷积层3,采用n3个d1×k1×k1的三维卷积核对池化层2输出的特征图组进行卷积运算,同时进行补零操作,输出n3个特征图组,每个特征图组包含l3个大小为h3×w3的特征图,其中,n3为正整数;
第七层为池化层3,采用d2×k2×k2的池化核对卷积层3输出的特征图组进行下采样操作,输出n3个特征图组,每个特征图组包含l4个大小为h4×w4的特征图,其中,l4、h4、w4为正整数;
第八层为卷积层4,采用n3个d1×k1×k1的三维卷积核对池化层3输出的特征图组进行卷积运算,同时进行补零操作,输出n3个特征图组,每个特征图组包含l4个大小为h4×w4的特征图;
第九层为池化层4,采用d2×k2×k2的池化核对卷积层4输出的特征图组进行下采样操作,输出n3个特征图组,每个特征图组包含l5个大小为h5×w5的特征图,其中,l5、h5、w5为正整数;
第十层为卷积层5,采用n3个d1×k1×k1的三维卷积核对池化层3输出的特征图组进行卷积运算,同时进行补零操作,输出n3个特征图组,每个特征图组包含l5个大小为h5×w5的特征图;
第十一层为池化层5,采用d2×k2×k2的池化核对卷积层5输出的特征图组进行下采样操作,输出n3个h6×w6的特征图,其中,h6、w6为正整数;
第十二层为全连接层,将池化层5的输出全连接至本层的n4个神经元,输出一个n4维的特征向量,其中,n4为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810145292.6/1.html,转载请声明来源钻瓜专利网。