[发明专利]一种基于李群论的多模态情感识别方法有效
申请号: | 201210466293.3 | 申请日: | 2012-11-16 |
公开(公告)号: | CN102968643A | 公开(公告)日: | 2013-03-13 |
发明(设计)人: | 王天江;刘芳;许春燕;杨勇;龚立宇;邵光普;舒禹程;曹守刚 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 李群 多模态 情感 识别 方法 | ||
技术领域
本发明属于情感识别领域,更具体地,涉及一种基于李群论的多模态情感识别方法。
背景技术
现有的情感识别方法,通产包括:人体、脸部等对象的跟踪、基于图像的情感分类、决策级融合等步骤。
对象跟踪从视频中跟踪目标得到它在每一帧中的位置。Ying Wu等使用两层的马尔科夫场来表示人体特征,进行人体跟踪。Dalal和Triggs采用方向梯度直方图来描述人的轮廓,通过使用不同位置和分辨率的窗口从图像中梯度方向直方图组合成特征向量,然后将特征向量输入支持向量机分类检测出人体并跟踪。Qiang Zhu等对Dalal等的方法进行改进,在计算方向梯度直方图时使用可变大小的块代替前者固定大小的块,使得性能有所改善。Pfinder系统通过特定的姿势分析出脸部、手、脚等位置,对每个区域用空间位置和颜色建模,然后用颜色对这些区域进行跟踪。其中如何抽取图像特征,建立跟踪模版,对跟踪对象进行准确跟踪是情感识别中一个重要问题。
情感模式挖掘从时间序列中挖掘出代表基本情感的运动特征模式。目前,从时间序列中进行数据挖掘有两类方法:一类是先对时间序列提取更高级的特征向量,再对特征向量进行分析。如Daniel Weinland等人提出的行为识别方法。但是,提取高层特征的过程通常伴随着信息的丢失,寻找一种合适的高层特征也需要先验知识。另一类方法是采用面向时间序列的机器学习方法,直接对时间序列进行挖掘,主要有隐式马尔科夫模型等方法。但是人体运动特征中的情感模式比较隐蔽,如何恰当地设计模型及其度量,是情感识别的一个难点。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种基于李群论的多模态情感识别方法,其根据视频中所包含的人体姿态运动信息、手势和脸部表情信息来判断人的情感状态,是一个将视频数据映射到人体运动特征、手势特征和脸部表情特征,再从人体运动特征空间和脸部表情特征映射到状态空间的过程,并提出利用李群论进行多模态情感识别,提高模型进行情感识别的精确性。
为实现上述目的,本发明提供了一种基于李群论的多模态情感识别方法,包括以下步骤:
步骤一,获取视频,并提取视频帧中图像区域的高斯型特征描述子,包括下述子步骤:
(1.1)对于图像区域中的每个像素点而言,计算一个d维特征向量F(x,y),该特征向量
(1.2)确定该图像区域对应的均值d维向量μ和协方差d维方阵,其中协方差矩阵Fk是图像区域中第k个像素点的特征向量,n是图像区域内像素点的总和,T表示矩阵的转置。
(1.3)基于步骤(1.1)和(1.2)的结果并结合李群论构建高斯型特征描述子;
步骤二,基于步骤一中得到的高斯型特征描述子,对视频中的图像区域进行跟踪,包括下述子步骤:
(2.1)在视频的第一帧中选取脸部区域、手部区域和人体区域;
(2.2)根据选取的脸部区域、手部区域和人体区域结合高斯型特征描述子构建跟踪模版;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210466293.3/2.html,转载请声明来源钻瓜专利网。