[发明专利]面向语音与面部表情信号的情感可视化方法在审

申请号：	201510932789.9	申请日：	2015-12-14
公开（公告）号：	CN105551499A	公开（公告）日：	2016-05-04
发明（设计）人：	韩志艳;王健;王东;尹作友;魏洪峰;郭兆正	申请（专利权）人：	渤海大学
主分类号：	G10L21/10	分类号：	G10L21/10;G10L25/63
代理公司：	锦州辽西专利事务所 21225	代理人：	李辉
地址：	121000 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种面向语音与面部表情信号的多模式情感可视化方法，其主要包括：情感信号获取、情感信号预处理、情感特征参数提取、神经网络设计及图像生成。本发明首先对获取的情感信号进行特征提取，然后将获取的情感特征作为神经网络的输入，神经网络的输出即为相应的图案信息，然后通过图像生成模块生成可视化图像，实现对中性、高兴、愤怒、惊奇、悲伤和恐惧六种人类基本情感的可视化。该方法通过组合不同模式的情感特征进入一幅图像中，为人们创造了情感的可读模式，显示直观且具有高鲁棒性。
搜索关键词：	面向语音面部表情信号情感可视化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种面向语音与面部表情信号的情感可视化方法，其特征是包括以下步骤：步骤1、情感信号获取；首先诱发情感，再同步获取相应情感状态下的语音信号和面部表情信号，并将二者绑定存储；步骤2、情感信号预处理；步骤2‑1、语音信号预处理；对获取的语音信号进行预处理，包括预加重、分帧加窗和端点检测；步骤2‑2、面部表情信号预处理；对获取的面部表情信号，首先进行脸部定位，然后进行图像几何特性归一化处理和图像光学特性归一化处理；步骤3、情感特征参数提取；步骤3‑1、语音情感特征参数提取；包括韵律特征和音质特征；步骤3‑2、面部表情特征参数提取；对预处理后的面部表情信号，采用Gabor小波变换来提取面部表情特征参数，具体过程如下：1)将预处理后的面部表情图像网格化；2)用Gabor小波和网格化后的图像进行卷积；3)取卷积结果的模的均值和方差作为面部表情特征参数；4)用主成分分析法PCA对上述面部表情特征参数进行降维处理，获得最终的面部表情特征参数；步骤4、神经网络设计；所述的神经网络为三层BP神经网络，其中输入层有46个神经元，输出层有3个神经元；步骤5、图像生成；步骤5‑1、图像主颜色编码；通过给屏幕相应位置的RGB赋值，即通过设定图像红色饱和度R、绿色饱和度G和蓝色饱和度B的值，来获得图像的主颜色信息；步骤5‑2、图案信息编码；神经网络的输出即为相应的图案信息，神经网络的输出层有3个神经元，均采用二进制编码，共有8个不同的码，其中利用前6个码，依次对应着中性、高兴、愤怒、惊奇、悲伤和恐惧6种人类基本情感；步骤5‑3、图像合成；图像合成时，把图像主颜色信息与图案信息融合在一幅图像中在显示屏上显示。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于渤海大学，未经渤海大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510932789.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]面向语音与面部表情信号的情感可视化方法在审

专利文献下载