[发明专利]基于多类核典型相关分析的多模态情感特征识别方法在审
申请号: | 201910144997.0 | 申请日: | 2019-02-27 |
公开(公告)号: | CN109815938A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 朱康;闫静杰;宋宇康;吕方惠;徐志鹏;卢官明 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 表情特征 情感识别 情感特征 数据矩阵 姿态特征 多模态 模态 融合 分析 语音特征数据 标准化处理 情感数据库 支持向量机 模态数据 模态特征 样本数据 语音特征 归一化 情绪 放入 样本 计算机 应用 | ||
1.一种基于多类核典型相关分析的多模态情感特征识别方法,其特征在于包括以下步骤:
(1)在包含多种模态数据的情感数据库中选取一定数量的样本;
(2)从上述样本数据中提取表情特征、语音特征和姿态特征,形成N*d1的表情特征数据矩阵、N*d2的语音特征数据矩阵和N*d3的姿态特征数据矩阵,其中N为样本个数,d1、d2、d3分别为每个样本的表情特征、语音特征和姿态特征的维度;
(3)将上述3个矩阵进行归一化和标准化处理,得到矩阵X1、X2、X3,矩阵X1、X2、X3中的数据都是归一的符合标准正态分布;
(4)使用多类核典型相关分析方法将多个模态的特征进行融合,得到融合后的特征;
(5)将融合后的特征放入支持向量机中进行情感识别。
2.根据权利要求1所述的基于多类核典型相关分析的多模态情感特征识别方法,其特征在于:步骤(2)中提取表情特征的方法为,先使用matlab的AAM算法程序检测出样本中人脸区域并裁剪出来,再将所裁剪的人脸部分图片重新规划成统一的尺寸,使用密集sift特征算法,计算得到d1维的sift特征,得到N*d1的表情特征数据矩阵。
3.根据权利要求1所述的基于多类核典型相关分析的多模态情感特征识别方法,其特征在于:步骤(2)中提取语音特征的方法为,使用工具opensmile中的emobase2010.conf特征集提取语音特征,用python对每段原始音频数据提取d2维的音频特征,得到N个文本格式的音频数据特征文件,之后使用matlab去除文件中的说明部分并进行格式的转换与所有数据的合并,得到N*d2的语音特征数据矩阵。
4.根据权利要求1所述的基于多类核典型相关分析的多模态情感特征识别方法,其特征在于:步骤(2)中提取姿态特征的方法为,使用matlab的lbptop算法程序,提取数据库中的全身视频图片帧之间的关联信息,对于一帧的图像进行分块,使用lbotop算法程序计算每张图片的特征,得到N个d3的特征数组,再另外使用matlab程序将其按样本顺序合并,最终获得N*d3的姿态特征数据矩阵。
5.根据权利要求1所述的基于多类核典型相关分析的多模态情感特征识别方法,其特征在于:步骤(3)中进行归一化和标准化处理的过程为:
(1)对所述3个矩阵进行归一化处理,即将每个样本的特征值都映射到区间[-1,1]中,最大值对应1,最小值对应-1;
(2)对特征值进行零均值标准化操作,即将每个样本的特征值减去该样本的均值后,除以该样本数据的标准差,得到的样本特征值遵循标准正态分布;
(3)对经上述标准化处理后的数据再进行归一化处理,得到归一化后的矩阵表情特征数据矩阵X1、语音特征数据矩阵X2和姿态特征数据矩阵X3。
6.根据权利要求1所述的基于多类核典型相关分析的多模态情感特征识别方法,其特征在于步骤(4)中融合的步骤是:
(1)建立投影方向Ψ1,Ψ2,Ψ3,使得之间获得最强的相关性,即使下列表达式的和最大:
求解出和最大时的投影方向Ψ1,Ψ2,Ψ3;
(2)得到融合后的特征
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910144997.0/1.html,转载请声明来源钻瓜专利网。