[发明专利]基于视频图像面部表情和语音的多模态儿童情绪识别融合模型在审
申请号: | 202110781866.0 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113408649A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 陈震环;李为相;王传昱 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G10L25/63;G10L25/30;G10L25/24;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211816 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于视频图像面部表情和语音的多模态儿童情绪识别模型,涉及情绪识别领域。在视频图像模态上,将面部表情训练数据使用Gabor滤波增强人脸纹理,然后将纹理增强后面部表情训练数据在稠密卷积神经网络(D)上进行训练,得到视频图像模态情绪识别模型;在语音模态上,将训练数据集的GFCC特征与MFCC特征进行融合,再输入至语音模态模型中进行训练,语音模态使用CGRU网络,CGRU网络由卷积神经网络(CNN)、门控循环单元(GRU)网络融合;最后将CGRU与SVM连接,得到语音情绪识别模型。视频图像模态识别结果和语音模态识别结果依据权值准则在决策层进行融合,实现多模态儿童情绪识别。本发明提供的技术方案,有效的提高儿童情绪识别的准确率,有较强的推广价值。 | ||
搜索关键词: | 基于 视频 图像 面部 表情 语音 多模态 儿童 情绪 识别 融合 模型 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110781866.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种利用青蟹调控红树林固着生物的方法及其应用
- 下一篇:气雾罐破拆装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序